CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.
Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.

Trong bối cảnh chuyển đổi số và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị. Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Mới đây, Viện Ứng dụng công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) - do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín, (https://rrc.cvc.uab.es/) được tổ chức bởi Trung tâm Thị giác máy tính (CVC) thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Cuộc thi khởi xướng từ năm 2011, được tổ chức thường niên trong khuôn khổ Hội nghị Quốc tế về phân tích và nhận dạng văn bản ICDAR – một trong những diễn đàn hàng đầu thế giới trong lĩnh vực thị giác máy tính. Cuộc thi thu hút đông đảo các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và các tập đoàn công nghệ lớn như Đại học Thanh Hoa, Hyundai Motor Group, Tencent… Các bài toán của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI chia sẻ: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Chỉ trong thời gian ngắn, đội ngũ nghiên cứu đã đạt thứ hạng cao, cho thấy năng lực cạnh tranh quốc tế với các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg
Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…). Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

Đáng chú ý, trên bảng xếp hạng RRC, CATI-VLM chỉ với 3 tỷ tham số nhưng đạt độ chính xác cao nhất ở 4/7 bộ dữ liệu, vượt trội nhiều mô hình Big Tech như Deepseek (27 tỷ tham số), GPT-4 Vision Turbo + Amazon Textract OCR (tốp 34) hay Baidu (tốp 22).

Thành tích cũng cho thấy cách tiếp cận thực chất, tập trung làm chủ lõi công nghệ, tối ưu hóa mô hình phù hợp với điều kiện hạ tầng của Việt Nam thay vì chạy theo quy mô tham số.

hinh-2.jpg
Ví dụ mẫu đơn tuyển sinh Đại học
hinh-3.jpg
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.

Ông Nguyễn Trung Chính, Chủ tịch Hội đồng quản trị, Chủ tịch Điều hành Tập đoàn Công nghệ CMC, nhấn mạnh: "Đây là thành quả của hơn một thập niên kiên trì đầu tư nghiên cứu-phát triển (R&D) công nghệ. Việc CMC đạt thành tích cao tại sân chơi công nghệ quốc tế khẳng định chiến lược làm chủ công nghệ Việt, đi đôi với định hướng Chuyển đổi AI và tiến ra thị trường toàn cầu. Chúng tôi tin trí tuệ Việt Nam hoàn toàn đủ năng lực sánh vai Big Tech toàn cầu, tạo vị thế xứng đáng trên bản đồ công nghệ thế giới."

CATI-VLM sẽ được ứng dụng trong chuỗi sản phẩm thuộc hệ sinh thái C.OpenAI, gồm: Trợ lý ảo CLS rà soát văn bản pháp luật, CMC SmartDoc – nền tảng chuyển đổi số tài liệu, Hệ quản trị tri thức CMC KMS, hệ thống báo cáo tự động cho văn phòng thông minh và các ứng dụng Agentic Documents thế hệ mới.

Có thể bạn quan tâm

Bên lề Đại hội, các đại biểu tham quan gian hàng của Công ty cổ phần Khoa học công nghệ Việt Nam (Busadco).

Doanh nghiệp khoa học-công nghệ: Củng cố nội lực để bứt phá

Trong bối cảnh đất nước bước vào kỷ nguyên kinh tế tri thức, với những đột phá mạnh mẽ về trí tuệ nhân tạo, chuyển đổi số và chuyển đổi xanh, cộng đồng doanh nghiệp khoa học-công nghệ đang đứng trước yêu cầu phải đổi mới tư duy, tái cấu trúc nguồn lực và đầu tư chiều sâu để tạo ra năng lực cạnh tranh mới.

[Video] Việt Nam tiên phong xây dựng khung pháp lý cho trí tuệ nhân tạo

[Video] Việt Nam tiên phong xây dựng khung pháp lý cho trí tuệ nhân tạo

Dự thảo Luật Trí tuệ nhân tạo không chỉ là khung pháp lý cho một công nghệ mới mà là bước đi chiến lược giúp Việt Nam chủ động nắm bắt cơ hội của kỷ nguyên số. Khi được ban hành, luật sẽ tạo nền tảng để AI phát triển an toàn nhân văn và hiệu quả, góp phần nâng cao năng lực cạnh tranh quốc gia và thúc đẩy đổi mới sáng tạo.

Các diễn giả trao đổi tại Diễn đàn. (Ảnh: Ủy ban Nhà nước về người Việt Nam ở nước ngoài)

Thúc đẩy hợp tác khoa học-công nghệ, kinh tế xanh và chuyển đổi số vì tương lai bền vững

Diễn đàn Tây Australia -Việt Nam “Tăng cường hợp tác khoa học và công nghệ vì tương lai bền vững” là cơ hội để lãnh đạo, chuyên gia, doanh nghiệp Việt Nam và Australia chia sẻ tầm nhìn, tăng cường hiểu biết và thúc đẩy hợp tác trong các lĩnh vực khoa học-công nghệ, kinh tế xanh, năng lượng tái tạo và chuyển đổi số.

Đại biểu tham dự hội thảo.

Vĩnh Long: Phối hợp chuyển giao ứng dụng khoa học-công nghệ phục vụ phát triển kinh tế-xã hội

Chiều 4/12, Văn phòng Bộ Khoa học và Công nghệ tại miền nam phối hợp Sở Khoa học và Công nghệ Vĩnh Long tổ chức Hội thảo với chủ đề “Phối hợp giữa Bộ Chủ trì Chương trình Khoa học-công nghệ cấp quốc gia với các địa phương trong chuyển giao ứng dụng kết quả nghiên cứu phục vụ phát triển kinh tế- xã hội khu vực phía nam”.

Ảnh minh họa.

Cảnh báo chiến dịch ‘Hanoi Thief’ tấn công mạng doanh nghiệp Việt Nam

Hàng loạt email giả mạo hồ sơ xin việc, đính kèm tệp “Le Xuan Son CV.zip”, được gửi đến các doanh nghiệp lớn, nhỏ tại Việt Nam. Đây là lớp vỏ ngụy trang cho chiến dịch tấn công mạng mang tên Hanoi Thief, với mục tiêu xâm nhập mạng nội bộ, chiếm quyền hệ thống và đánh cắp dữ liệu khách hàng, bí mật doanh nghiệp.

Toàn cảnh tọa đàm.

Những nghiên cứu mới hỗ trợ ngành nông nghiệp giảm phát thải, chăn nuôi bền vững

Các giải pháp đổi mới trong nông nghiệp và chăn nuôi bền vững, bao gồm việc áp dụng công nghệ gene, hệ vi sinh vật, nông nghiệp chính xác, AI và IoT để cải thiện năng suất, giảm hóa chất và phát thải, nâng cao khả năng chống chịu với biến đổi khí hậu vừa được giới thiệu tại tọa đàm “Đổi mới trong nông nghiệp và thực phẩm”.

Lễ khai mạc triển lãm “Tỏa V-Điểm chạm khoa học”.

Chín nghệ sĩ tiêu biểu của nghệ thuật đương đại Việt Nam trưng bày tác phẩm tại triển lãm "Tỏa V-Điểm chạm khoa học"

Triển lãm “Tỏa V-Điểm chạm khoa học” tôn vinh những thành tựu khoa học và ứng dụng sáng tạo vì sự phát triển bền vững và tương lai của nhân loại. Sự kiện nghệ thuật đặc biệt đánh dấu cột mốc kỷ niệm 5 năm Giải thưởng VinFuture cũng như 5 mùa triển lãm "Tỏa" của VCCA.

Lãnh đạo Thành phố Hồ Chí Minh chụp hình lưu niệm cùng các đại biểu dự hội nghị.

Khai mạc Hội nghị thượng đỉnh toàn cầu Diễn đàn cộng đồng thông minh thế giới 2025

Sáng 3/12, tại phường Bình Dương (Thành phố Hồ Chí Minh), đã diễn ra Lễ khai mạc Hội nghị thượng đỉnh toàn cầu Diễn đàn cộng đồng thông minh thế giới (ICF Global Summit 2025) do Ủy ban nhân dân Thành phố Hồ Chí Minh phối hợp Diễn đàn cộng đồng thông minh thế giới (ICF) và Tập đoàn Becamex đăng cai tổ chức.