CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.
Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.

Trong bối cảnh chuyển đổi số và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị. Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Mới đây, Viện Ứng dụng công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) - do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín, (https://rrc.cvc.uab.es/) được tổ chức bởi Trung tâm Thị giác máy tính (CVC) thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Cuộc thi khởi xướng từ năm 2011, được tổ chức thường niên trong khuôn khổ Hội nghị Quốc tế về phân tích và nhận dạng văn bản ICDAR – một trong những diễn đàn hàng đầu thế giới trong lĩnh vực thị giác máy tính. Cuộc thi thu hút đông đảo các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và các tập đoàn công nghệ lớn như Đại học Thanh Hoa, Hyundai Motor Group, Tencent… Các bài toán của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI chia sẻ: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Chỉ trong thời gian ngắn, đội ngũ nghiên cứu đã đạt thứ hạng cao, cho thấy năng lực cạnh tranh quốc tế với các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg
Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…). Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

Đáng chú ý, trên bảng xếp hạng RRC, CATI-VLM chỉ với 3 tỷ tham số nhưng đạt độ chính xác cao nhất ở 4/7 bộ dữ liệu, vượt trội nhiều mô hình Big Tech như Deepseek (27 tỷ tham số), GPT-4 Vision Turbo + Amazon Textract OCR (tốp 34) hay Baidu (tốp 22).

Thành tích cũng cho thấy cách tiếp cận thực chất, tập trung làm chủ lõi công nghệ, tối ưu hóa mô hình phù hợp với điều kiện hạ tầng của Việt Nam thay vì chạy theo quy mô tham số.

hinh-2.jpg
Ví dụ mẫu đơn tuyển sinh Đại học
hinh-3.jpg
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.

Ông Nguyễn Trung Chính, Chủ tịch Hội đồng quản trị, Chủ tịch Điều hành Tập đoàn Công nghệ CMC, nhấn mạnh: "Đây là thành quả của hơn một thập niên kiên trì đầu tư nghiên cứu-phát triển (R&D) công nghệ. Việc CMC đạt thành tích cao tại sân chơi công nghệ quốc tế khẳng định chiến lược làm chủ công nghệ Việt, đi đôi với định hướng Chuyển đổi AI và tiến ra thị trường toàn cầu. Chúng tôi tin trí tuệ Việt Nam hoàn toàn đủ năng lực sánh vai Big Tech toàn cầu, tạo vị thế xứng đáng trên bản đồ công nghệ thế giới."

CATI-VLM sẽ được ứng dụng trong chuỗi sản phẩm thuộc hệ sinh thái C.OpenAI, gồm: Trợ lý ảo CLS rà soát văn bản pháp luật, CMC SmartDoc – nền tảng chuyển đổi số tài liệu, Hệ quản trị tri thức CMC KMS, hệ thống báo cáo tự động cho văn phòng thông minh và các ứng dụng Agentic Documents thế hệ mới.

Có thể bạn quan tâm

Nhóm nghiên cứu thực hiện nghiên cứu các hợp chất sau chiết xuất của cây nghệ trắng. (Ảnh: TRUNG HIẾU)

Nghệ trắng và triển vọng hỗ trợ điều trị ung thư dạ dày

Lần đầu tiên, cao chiết chuẩn hóa từ thân rễ nghệ trắng trồng tại Trà Vinh được chứng minh có khả năng ức chế nhiều dòng tế bào ung thư, đặc biệt là ung thư dạ dày, đồng thời ít ảnh hưởng đến tế bào bình thường. Kết quả này mở ra triển vọng khai thác dược liệu Việt Nam trong hỗ trợ phòng ngừa và điều trị ung thư.

Hoạt động nghiên cứu khoa học tại Đại học Quốc gia Thành phố Hồ Chí Minh.

Xây dựng đội ngũ nhà khoa học trình độ cao

Tại cuộc họp Thường trực Ban Chỉ đạo Trung ương về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số, Tổng Bí thư, Chủ tịch nước Tô Lâm khẳng định vai trò đặc biệt quan trọng của khoa học cơ bản chính là nền tảng để hình thành các lý thuyết mới, công nghệ mới và các mô hình phát triển bền vững.

Một sản phẩm công nghệ mới trưng bày tại triển lãm công nghệ năng lượng mặt trời và hệ thống lưu trữ Solar & Storage Live 2024 tại thành phố Johannesburg, Nam Phi. (Ảnh: TTXVN)

Thúc đẩy tự chủ chiến lược về hạ tầng công nghệ

Bốn nền kinh tế công nghệ lớn nhất châu Phi đã soạn thảo các chiến lược về trí tuệ nhân tạo (AI) trong bối cảnh họ thừa nhận phụ thuộc quá nhiều vào các công ty công nghệ Mỹ về cơ sở hạ tầng. Với sự hỗ trợ của công nghệ phương Tây, các công ty châu Phi đang bắt đầu xây dựng cơ sở hạ tầng AI. 

Nghiên cứu phát triển khoa học và công nghệ là một trong những nhiệm vụ trọng tâm trong giai đoạn hiện nay.

Nâng cao năng lực khoa học và công nghệ quốc gia, góp phần làm chủ công nghệ chiến lược

Chính phủ vừa ban hành Nghị định số 229/2026/NĐ-CP ngày 25/6/2026 quy định về tổ chức và hoạt động của Quỹ Phát triển khoa học và công nghệ quốc gia. Nghị định gồm 8 chương và 39 điều, tập trung tháo gỡ những vướng mắc về tổ chức, cơ chế hoạt động; đồng thời để Quỹ thực hiện chức năng, nhiệm vụ phù hợp các quy định mới. 

Sự kiện thu hút hơn 300 đối tác chiến lược và đại diện các doanh nghiệp công nghệ trong khu vực.

Khai mạc Hội nghị thượng đỉnh Đối tác Đông Nam Á 2026

Ngày 26/6, tại Thành phố Hồ Chí Minh, Hội nghị thượng đỉnh Đối tác Đông Nam Á 2026 (Huawei SEA Partner Summit 2026) đã chính thức khai mạc với chủ đề “Hợp tác để khai phóng tương lai xanh và thông minh” (Partnering To Ignite The Intelligent và Green Future).

Bí thư Tỉnh ủy Đắk Lắk Lương Nguyễn Minh Triết phát biểu tại hội thảo.

Đắk Lắk đẩy mạnh chuyển đổi số và phát triển hệ sinh thái doanh nghiệp bền vững

Trong khuôn khổ chuỗi sự kiện công bố điều chỉnh quy hoạch tỉnh Đắk Lắk thời kỳ 2021-2030, tầm nhìn đến năm 2050 và xúc tiến đầu tư năm 2026, sáng 26/6, Sở Khoa học và Công nghệ tỉnh Đắk Lắk phối hợp các cơ quan, đơn vị tổ chức Hội thảo chuyên đề “Chuyển đổi số và phát triển hệ sinh thái doanh nghiệp bền vững”.

Hội thảo Việt Nam-Lào về phát triển hạ tầng tin cậy số và ứng dụng chữ ký số trong các lĩnh vực.

Việt Nam-Lào hợp tác về phát triển hạ tầng tin cậy số và ứng dụng chữ ký số

Chiều 25/6, tại thủ đô Vientiane (Lào), Trung tâm Chứng thực điện tử quốc gia Việt Nam (NEAC), Bộ Khoa học và Công nghệ Việt Nam phối hợp Trung tâm Internet quốc gia Lào (LANIC), Bộ Công nghệ và Truyền thông Lào tổ chức Hội thảo Việt Nam-Lào về phát triển hạ tầng tin cậy số và ứng dụng chữ ký số trong các lĩnh vực.

Nhóm nghiên cứu của Viettel AI xây dựng mới bộ dữ liệu các khuôn mặt bị che khuất để huấn luyện mô hình AI. (Ảnh: Quỳnh Trang)

Giải pháp Viettel AI được bảo hộ tại Hoa Kỳ nhờ bài toán nhận diện khuôn mặt bị che khuất

Ngày 26/6, Tập đoàn Công nghiệp-Viễn thông Quân đội Viettel cho biết, năng lực nghiên cứu công nghệ lõi của Viettel AI được khẳng định khi Văn phòng Sáng chế và Nhãn hiệu Hoa Kỳ (USPTO) vừa cấp bằng sáng chế hữu ích cho phương pháp “Nhận diện khuôn mặt có đeo khẩu trang qua hình ảnh sử dụng công nghệ trí tuệ nhân tạo”.

Diễn đàn đối thoại chiến lược 2026 tại Hà Nội bàn cách xác lập mô hình tăng trưởng mới dựa trên công nghệ chiến lược, đổi mới sáng tạo và nguồn nhân lực chất lượng cao.

Phát huy công nghệ chiến lược, xác lập mô hình tăng trưởng mới

Ngày 25/6, tại Hà Nội, Bộ Ngoại giao phối hợp Phòng Thương mại Hoa Kỳ tại ASEAN, Tổ chức Hợp tác và Phát triển kinh tế (OECD) cùng các đối tác tổ chức Diễn đàn đối thoại chiến lược với chủ đề “Xác lập mô hình tăng trưởng mới: Phát huy các công nghệ chiến lược để nâng cao năng lực cạnh tranh và tăng trưởng bền vững”. 

Triển lãm Quốc tế Vietnam ICTCOMM 2026 diễn ra từ 24-26/6 tại Thành phố Hồ Chí Minh.

Doanh nghiệp vận hành trên nền tảng AI – Tương lai của chuyển đổi số

Diễn ra từ ngày 24-26/6/2026 tại Thành phố Hồ Chí Minh, Vietnam ICTCOMM 2026 quy tụ hàng trăm doanh nghiệp công nghệ trong các lĩnh vực ICT, AI, IoT, Cloud, Data Center và Cybersecurity. Theo Ban tổ chức, ngày khai mạc đã thu hút hơn 2.000 lượt khách tham quan cùng nhiều hội thảo chuyên đề về chuyển đổi số và trí tuệ nhân tạo.

Báo chí thế giới tái định vị giữa "gọng kìm" của AI và người sáng tạo nội dung

Báo chí thế giới tái định vị giữa "gọng kìm" của AI và người sáng tạo nội dung

Sự trỗi dậy của các “bộ máy trả lời bằng AI” làm bốc hơi lưu lượng truy cập truyền thống. Làn sóng người sáng tạo nội dung đang cướp đi sự chú ý cũng như nhân tài của báo chí chính thống. Phản ứng chiến lược được nhiều cơ quan báo chí lựa chọn là tập trung vào những thứ máy móc không thể sao chép.

Tăng cường bảo mật ngân hàng. (Đồ họa: HỒNG ANH)

Chống lừa đảo AI trong ngành ngân hàng

Sự phát triển của trí tuệ nhân tạo (AI) đang mở ra nhiều cơ hội cho ngành ngân hàng trong việc nâng cao hiệu quả vận hành, quản trị rủi ro và cải thiện trải nghiệm khách hàng. Tuy nhiên, chính công nghệ này cũng đang bị tội phạm mạng lợi dụng để tạo ra các hình thức lừa đảo ngày càng tinh vi.

Hội nghị sơ kết công tác quản lý lĩnh vực thông tin điện tử 6 tháng đầu năm 2026.

Tăng cường xử lý vi phạm trên không gian mạng

Chiều 24/6, tại Hà Nội, Cục Phát thanh, Truyền hình và Thông tin điện tử (Bộ Văn hóa, Thể thao và Du lịch) tổ chức Hội nghị sơ kết công tác quản lý lĩnh vực thông tin điện tử 6 tháng đầu năm 2026.

Hoạt động nghiên cứu, thí nghiệm thực hành của sinh viên Trường đại học Việt Nhật. (Ảnh: DIỆP NGỌC)

Chuyển đổi số trong quản trị đại học: Đột phá đào tạo song hành và lực lượng lao động kỷ nguyên mới

Giáo dục nước ta đang đứng trước bước ngoặt mang tính cách mạng về cấu trúc thể chế, triết lý vận hành thích ứng kỷ nguyên số. Áp lực toàn cầu hóa và cách mạng công nghiệp lần thứ tư đã định hình hệ thống giáo dục đại học và nghề nghiệp theo hướng song hành thực học, thực nghiệp thay thế mô hình hàn lâm truyền thống.