← VnExpress Khoa học công nghệ

MedCAT IDUS

MedCAT IDUS
 
 

MedCAT IDUS - Intelligent Document Understanding & Structuring

MedCAT IDUS là nền tảng AI "make in Vietnam" giúp doanh nghiệp biến núi dữ liệu phi cấu trúc thành tài sản số sẵn sàng cho phân tích và tự động hóa.

Khác với các giải pháp OCR truyền thống, IDUS kết hợp LLM + VLM - cặp mô hình ngôn ngữ lớn và ngôn ngữ-thị giác - để đọc hiểu, trích xuất, chuẩn hóa và chuyển đổi mọi định dạng tài liệu: hóa đơn, bảng xét nghiệm, hợp đồng, đơn bồi thường, báo cáo PDF, ảnh chụp... mà không phụ thuộc form biểu mẫu, không phải học lại. AI lõi được phát triển hoàn toàn nội bộ; hệ thống không gọi API bên ngoài, bảo đảm chủ quyền & an toàn dữ liệu tuyệt đối.

Thuật toán của IDUS nhận diện bối cảnh, cấu trúc lô-gic trong từng trường thông tin, đạt trên 97 % độ chính xác ở cấp trường dữ liệu - ngay cả với bảng biểu phức tạp. Kết quả được đổ trực tiếp vào kho dữ liệu linh hoạt (data lake/data warehouse), tạo "nhiên liệu sạch" cho LLM, chatbot, dashboard BI và các quy trình RPA.

Với IDUS, doanh nghiệp chỉ cần nhân sự xem xét và phê duyệt kết quả; thao tác nhập tay gần như triệt tiêu, tăng năng suất lao động của khâu nhập liệu ít nhất 10 lần. Nền tảng tự mở rộng quy mô trên cloud, xử lý hàng nghìn tài liệu song song, rút ngắn thời gian xử lý và cắt giảm chi phí vận hành, đồng thời mở ra cơ hội khai thác dữ liệu thời gian thực cho quyết định chiến lược.

Từ ngân hàng, bảo hiểm, y tế đến hành chính công, MedCAT IDUS đang giải phóng giá trị 80 % dữ liệu phi cấu trúc, thúc đẩy quyết định dữ liệu - định hướng và tăng tốc chuyển đổi số cho mọi ngành.

MedCAT IDUS - chủ động dữ liệu, tăng tốc chuyển đổi số, sẵn sàng cho kỷ nguyên AI.

Điểm mới

MedCAT IDUS mở ra kỷ nguyên trích xuất tài liệu "cắm là chạy" cho doanh nghiệp Việt Nam.

1. Kết hợp giữa LLM + VLM

Nền tảng kết hợp mô hình ngôn ngữ lớn với mô hình ngôn ngữ - thị giác, nên không chỉ đọc ký tự mà còn hiểu bố cục, quan hệ bảng biểu và ngữ nghĩa từng trường dữ liệu - điều OCR truyền thống không làm được.

2. AI lõi tự phát triển, "zero external API"

Tất cả thuật toán và mô hình AI đều do MedCAT xây dựng; dữ liệu không rời hạ tầng cloud bảo mật của MedCAT, bảo đảm chủ quyền, tuân thủ và tránh phụ thuộc công nghệ nước ngoài.

3. Cloud-native auto-scaling - Kiến trúc đám mây gốc tự động co giãn

IDUS xử lý từ vài trăm đến hàng chục nghìn tài liệu trong thời gian thực mà không cần can thiệp hạ tầng thủ công.

4. Low-code, user-defined field configuration

Người dùng tự chọn và sắp xếp chính xác các trường cần trích xuất, thiết lập quy tắc chuẩn hóa và ánh xạ sang schema đích trong vài phút. Mọi thay đổi được áp dụng tức thời, không cần viết mã hay tái triển khai, giúp doanh nghiệp linh hoạt đáp ứng mẫu tài liệu mới và yêu cầu nghiệp vụ biến động.

5. Độ chính xác > 97 % ở cấp ô dữ liệu

Thuật toán ngữ nghĩa sâu giúp giữ nguyên bối cảnh, đơn vị và định dạng, kể cả với bảng xét nghiệm hay hóa đơn phức tạp.

6. Quy trình review-only, tăng năng suất ≥ 10 lần

Nhân sự chỉ cần rà soát, chỉnh sửa nếu cần và phê duyệt; thao tác nhập tay gần như biến mất. Doanh nghiệp rút ngắn thời gian xử lý hồ sơ, giảm chi phí và loại bỏ sai sót lặp lại. Nhờ bộ tính năng này, MedCAT IDUS không chỉ bóc tách mà còn chuẩn hóa và đổ dữ liệu sạch vào data lake/warehouse, biến 80 % "dữ liệu bán/phi cấu trúc" thành nhiên liệu thời gian thực cho BI, chatbot và mô hình LLM. Từ bảo hiểm, ngân hàng, y tế đến hành chính công, IDUS đang tăng tốc chuyển đổi số, cho phép các tổ chức ra quyết định dựa trên dữ liệu - nhanh, chính xác và an toàn.

Đội ngũ phát triển: 15