GenAI-OCR
GenAI-OCR là nền tảng dành cho doanh nghiệp, giúp tự động trích xuất thông tin dữ liệu có cấu trúc như tên sản phẩm, mã sản phẩm, thông số kỹ thuật, giá cả... từ những tài liệu không theo mẫu cố định, có chứa cả hình ảnh, chẳng hạn như các catalog PDF dài hàng trăm trang, chỉ trong vài phút. Dữ liệu trích xuất có thể dễ dàng kết nối với hệ thống nội bộ thông qua các định dạng như Excel, CSV hoặc API.
Hệ thống kết hợp mô hình ngôn ngữ lớn đa phương thức (Multimodal LLM) và công nghệ nhận dạng văn bản trong ảnh (Vision-OCR) do chính chúng tôi phát triển. Nhờ đó, nó có khả năng hiểu ngữ cảnh, phân tích cả bảng biểu, bố cục nhiều cột hay chú thích. Ngay cả với những catalog có cấu trúc phức tạp, hệ thống vẫn có thể trích xuất chính xác tới 99% các thông tin cần thiết.
Nhờ công nghệ này, công việc nhập tay dữ liệu sản phẩm từ catalog vào Excel hay hệ thống nội bộ có thể được tự động hóa hoàn toàn, giúp giảm đáng kể chi phí nhân sự.
Vì công nghệ OCR sẵn có vốn không thể đạt độ chính xác tuyệt đối 100%, hệ thống còn có tính năng chỉnh sửa tiện lợi, giúp người dùng dễ dàng sửa lại những phần thông tin nhận dạng chưa chính xác.
Không chỉ dừng lại ở catalog sản phẩm, nền tảng này còn có thể xử lý nhiều loại tài liệu khác như hóa đơn, đơn đăng ký, hợp đồng và nhiều tài liệu doanh nghiệp khác.
Hiện giải pháp đã được các doanh nghiệp lớn trong các ngành xây dựng, sản xuất, may mặc, hóa chất, thực phẩm và các dịch vụ EC B2B,... tại Nhật Bản triển khai, giúp giảm trung bình 90 % khối lượng công việc nhập liệu thủ công.
Điểm mới:
Trích xuất siêu nhanh tài liệu lớn trên 100 trang nhiều hình ảnh. Triển khai linh hoạt và chỉnh sửa nâng cao giúp tối ưu độ chính xác dữ liệu AI