CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.
Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.

Trong bối cảnh chuyển đổi số và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị. Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Mới đây, Viện Ứng dụng công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) - do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín, (https://rrc.cvc.uab.es/) được tổ chức bởi Trung tâm Thị giác máy tính (CVC) thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Cuộc thi khởi xướng từ năm 2011, được tổ chức thường niên trong khuôn khổ Hội nghị Quốc tế về phân tích và nhận dạng văn bản ICDAR – một trong những diễn đàn hàng đầu thế giới trong lĩnh vực thị giác máy tính. Cuộc thi thu hút đông đảo các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và các tập đoàn công nghệ lớn như Đại học Thanh Hoa, Hyundai Motor Group, Tencent… Các bài toán của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI chia sẻ: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Chỉ trong thời gian ngắn, đội ngũ nghiên cứu đã đạt thứ hạng cao, cho thấy năng lực cạnh tranh quốc tế với các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg
Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…). Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

Đáng chú ý, trên bảng xếp hạng RRC, CATI-VLM chỉ với 3 tỷ tham số nhưng đạt độ chính xác cao nhất ở 4/7 bộ dữ liệu, vượt trội nhiều mô hình Big Tech như Deepseek (27 tỷ tham số), GPT-4 Vision Turbo + Amazon Textract OCR (tốp 34) hay Baidu (tốp 22).

Thành tích cũng cho thấy cách tiếp cận thực chất, tập trung làm chủ lõi công nghệ, tối ưu hóa mô hình phù hợp với điều kiện hạ tầng của Việt Nam thay vì chạy theo quy mô tham số.

hinh-2.jpg
Ví dụ mẫu đơn tuyển sinh Đại học
hinh-3.jpg
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.

Ông Nguyễn Trung Chính, Chủ tịch Hội đồng quản trị, Chủ tịch Điều hành Tập đoàn Công nghệ CMC, nhấn mạnh: "Đây là thành quả của hơn một thập niên kiên trì đầu tư nghiên cứu-phát triển (R&D) công nghệ. Việc CMC đạt thành tích cao tại sân chơi công nghệ quốc tế khẳng định chiến lược làm chủ công nghệ Việt, đi đôi với định hướng Chuyển đổi AI và tiến ra thị trường toàn cầu. Chúng tôi tin trí tuệ Việt Nam hoàn toàn đủ năng lực sánh vai Big Tech toàn cầu, tạo vị thế xứng đáng trên bản đồ công nghệ thế giới."

CATI-VLM sẽ được ứng dụng trong chuỗi sản phẩm thuộc hệ sinh thái C.OpenAI, gồm: Trợ lý ảo CLS rà soát văn bản pháp luật, CMC SmartDoc – nền tảng chuyển đổi số tài liệu, Hệ quản trị tri thức CMC KMS, hệ thống báo cáo tự động cho văn phòng thông minh và các ứng dụng Agentic Documents thế hệ mới.

Có thể bạn quan tâm

Các đại biểu tham dự hội thảo quốc tế do Trường đại học Intracom phối hợp các đơn vị tổ chức. (Ảnh: NHẬT MINH)

Ứng dụng khoa học và công nghệ vào cuộc sống - Từ lý luận đến thực tiễn

Ngày 28/1, tại Hà Nội, Trường đại học Intracom phối hợp Tạp chí Pháp luật và Phát triển, Viện khoa học và Bổ trợ Tư pháp (Liên hiệp Hội Người khuyết tật Việt Nam), Tạp chí Vận động, Nghiên cứu và Giáo dục (JARE)… tổ chức hội thảo quốc tế “Thúc đẩy ứng dụng khoa học và công nghệ vào cuộc sống - Từ lý luận đến thực tiễn”.

Người dân đến giải quyết thủ tục hành chính tại Trung tâm Phục vụ Hành chính công-Chi nhánh số 3-phường Đống Đa, Hà Nội. (Ảnh: nhandan.vn)

Khai thác hiệu quả cơ sở dữ liệu quốc gia

Cơ sở dữ liệu quốc gia về cán bộ, công chức, viên chức có vai trò thống nhất và chuẩn hóa thông tin nhân sự trong toàn bộ hệ thống cơ quan nhà nước, từ đó có cái nhìn toàn diện về số lượng, chất lượng, cơ cấu đội ngũ nhằm đưa ra các quyết định quản lý và sử dụng nhân sự một cách khoa học, hợp lý.

Sinh viên Trường đại học Khoa học xã hội và nhân văn Thành phố Hồ Chí Minh thực hành nghiên cứu khoa học.

Đổi mới nghiên cứu liên ngành trong lĩnh vực khoa học xã hội

Trong thời đại ngày nay, nhiều vấn đề không chỉ là sự quan tâm của một quốc gia đơn lẻ, mà trở thành vấn đề chung của cả khu vực và thế giới. Theo đó, thúc đẩy nghiên cứu đa ngành là con đường tất yếu để giải quyết các vấn đề thực tiễn một cách toàn diện và hiệu quả.

100% cử tri có mặt tại Hội nghị nhất trí giới thiệu đồng chí Vũ Hải Quân, Ủy viên Trung ương Đảng, Thứ trưởng Thường trực Bộ Khoa học và Công nghệ ứng cử đại biểu Quốc hội khóa XVI.

Bộ Khoa học và Công nghệ giới thiệu Thứ trưởng Thường trực Vũ Hải Quân ứng cử Đại biểu Quốc hội khóa XVI

150/150 cử tri có mặt tại hội nghị lấy ý kiến cử tri nơi công tác đối với người được dự kiến giới thiệu ứng cử Đại biểu Quốc hội khóa XVI của Bộ Khoa học và Công nghệ đã nhất trí giới thiệu Thứ trưởng Thường trực Bộ Khoa học và Công nghệ Vũ Hải Quân ứng cử Đại biểu Quốc hội khóa XVI.

Đông đảo người dân tham dự triển lãm.

Đẩy mạnh ứng dụng khoa học tiên tiến để bảo tồn và phát triển dược liệu

Sáng 23/1, Viện Dược liệu phối hợp UBND phường Cửa Nam (Hà Nội) tổ chức Triển lãm Sách và Dược liệu Việt Nam với chủ đề “Kết nối tri thức vì sức khỏe cộng đồng” tại Phố Sách Hà Nội. Triển lãm nhằm chào mừng Đại hội đại biểu toàn quốc lần thứ XIV của Đảng, kỷ niệm 96 năm Ngày thành lập Đảng và 71 năm Ngày Thầy thuốc Việt Nam.

Người dân cần kiểm tra kỹ thông tin trước khi nộp tiền phạt qua mã QR để tránh bị lừa.

Nhận diện chiêu thức lừa đảo nộp phạt “nguội” qua Zalo

Lợi dụng việc mã QR được sử dụng rộng rãi trong các thủ tục hành chính, nhiều đối tượng xấu đã giả mạo thông báo “phạt nguội”, yêu cầu người dân chuyển tiền qua mã QR trên Zalo. Người dân cần nhận diện rõ quy trình nộp phạt hợp pháp và nâng cao cảnh giác để tránh bị lừa.

Cán bộ Sở Khoa học và Công nghệ Thái Nguyên khảo sát để cấp chỉ dẫn địa lý cho gạo nếp Khẩu Nua Lếch. (Ảnh: THU HIỀN)

Đổi mới sáng tạo ở Thái Nguyên

Tỉnh Thái Nguyên đã và đang khẳng định quyết tâm biến khoa học, công nghệ trở thành khâu đột phá để thúc đẩy kinh tế-xã hội. Với hệ sinh thái đổi mới sáng tạo, Thái Nguyên từng bước đẩy nhanh phát triển kinh tế số, nâng cao năng suất, chất lượng và sức cạnh tranh của nền kinh tế.

Thủ tướng Chính phủ Phạm Minh Chính và các đồng chí lãnh đạo Đảng, Nhà nước tham quan các khu vực bên lề lễ khởi công nhà máy chế tạo chip bán dẫn Hòa Lạc.

Việt Nam sẽ bước vào nhóm số ít quốc gia sở hữu năng lực chế tạo chip bán dẫn

Chip bán dẫn hiện là “đòn bẩy” của những nước chi phối công nghệ sản xuất, sử dụng như công cụ chính trị để kiểm soát, kìm hãm kinh tế, công nghiệp an ninh quốc phòng. Việt Nam xác định bán dẫn là một trong những công nghệ chiến lược cần làm chủ, với mắt xích then chốt vừa được công bố: nhà máy sản xuất chip tại Hòa Lạc.

Ứng dụng khoa học, công nghệ là giải pháp hiệu quả để quản lý, bảo vệ tài nguyên biển.

Ứng dụng công nghệ trong quản lý các khu bảo tồn biển

Đến năm 2030, Việt Nam có 27 khu bảo tồn biển, trong đó có 16 khu bảo tồn biển cấp quốc gia, 11 cấp tỉnh với khoảng 20 hệ sinh thái, 11.000 loại thủy sản, khoảng 3.000 đảo. Đây là địa điểm lý tưởng để thực hiện nhiệm vụ lưu giữ, bảo tồn giống, nguồn gen, đa dạng sinh học; phát triển kinh tế, du lịch; phục vụ nghiên cứu khoa học…