CMC đạt tốp 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM (Visual Document Understanding) do Viện Ứng dụng công nghệ CMC(CMC ATI) phát triển đã vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA)

Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.
Bảng xếp hạng của RRC trong hạng mục DocVQA 6/2025.

Trong bối cảnh chuyển đổi số và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị. Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Mới đây, Viện Ứng dụng công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) - do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, vượt qua nhiều đối thủ quốc tế đạt tốp 12 thế giới và tốp 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín, (https://rrc.cvc.uab.es/) được tổ chức bởi Trung tâm Thị giác máy tính (CVC) thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Cuộc thi khởi xướng từ năm 2011, được tổ chức thường niên trong khuôn khổ Hội nghị Quốc tế về phân tích và nhận dạng văn bản ICDAR – một trong những diễn đàn hàng đầu thế giới trong lĩnh vực thị giác máy tính. Cuộc thi thu hút đông đảo các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và các tập đoàn công nghệ lớn như Đại học Thanh Hoa, Hyundai Motor Group, Tencent… Các bài toán của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI chia sẻ: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Chỉ trong thời gian ngắn, đội ngũ nghiên cứu đã đạt thứ hạng cao, cho thấy năng lực cạnh tranh quốc tế với các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg
Tiến sĩ Đặng Minh Tuấn, Viện trưởng CMC ATI.

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…). Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

Đáng chú ý, trên bảng xếp hạng RRC, CATI-VLM chỉ với 3 tỷ tham số nhưng đạt độ chính xác cao nhất ở 4/7 bộ dữ liệu, vượt trội nhiều mô hình Big Tech như Deepseek (27 tỷ tham số), GPT-4 Vision Turbo + Amazon Textract OCR (tốp 34) hay Baidu (tốp 22).

Thành tích cũng cho thấy cách tiếp cận thực chất, tập trung làm chủ lõi công nghệ, tối ưu hóa mô hình phù hợp với điều kiện hạ tầng của Việt Nam thay vì chạy theo quy mô tham số.

hinh-2.jpg
Ví dụ mẫu đơn tuyển sinh Đại học
hinh-3.jpg
Văn bản đã được nhận dạng từ chữ viết tay ở hình trên.

Ông Nguyễn Trung Chính, Chủ tịch Hội đồng quản trị, Chủ tịch Điều hành Tập đoàn Công nghệ CMC, nhấn mạnh: "Đây là thành quả của hơn một thập niên kiên trì đầu tư nghiên cứu-phát triển (R&D) công nghệ. Việc CMC đạt thành tích cao tại sân chơi công nghệ quốc tế khẳng định chiến lược làm chủ công nghệ Việt, đi đôi với định hướng Chuyển đổi AI và tiến ra thị trường toàn cầu. Chúng tôi tin trí tuệ Việt Nam hoàn toàn đủ năng lực sánh vai Big Tech toàn cầu, tạo vị thế xứng đáng trên bản đồ công nghệ thế giới."

CATI-VLM sẽ được ứng dụng trong chuỗi sản phẩm thuộc hệ sinh thái C.OpenAI, gồm: Trợ lý ảo CLS rà soát văn bản pháp luật, CMC SmartDoc – nền tảng chuyển đổi số tài liệu, Hệ quản trị tri thức CMC KMS, hệ thống báo cáo tự động cho văn phòng thông minh và các ứng dụng Agentic Documents thế hệ mới.

Có thể bạn quan tâm

Công tác dự báo và cảnh báo sớm chính là “tuyến phòng thủ” đầu tiên, giữ vai trò quyết định trong bảo vệ tính mạng người dân và tài sản. (Ảnh: TRỌNG TÙNG)

Rút ngắn thời gian phản ứng với thiên tai

Việc cảnh báo thiên tai sẽ chỉ thật sự hiệu quả khi thông tin nguy hiểm đến đúng người, đúng nơi và đúng thời điểm. Các mô hình tháp báo lũ thông minh và mạng quan trắc tự động đang giúp việc đưa dữ liệu về ngập lụt tới cộng đồng nhanh hơn, rút ngắn thời gian phản ứng của người dân khi thiên tai xảy ra.

Tiến sĩ Lê Xuân Huy, Phó Tổng Giám đốc VNSC và ông Yasuo Ishii, Phó Chủ tịch cấp cao JAXA trao thỏa thuận hợp tác. (Ảnh: VNSC)

Trung tâm Vũ trụ Việt Nam ký thỏa thuận hợp tác với Cơ quan Hàng không Vũ trụ Nhật Bản

Ngày 2/5, tại Hà Nội, lãnh đạo Trung tâm Vũ trụ Việt Nam (VNSC) và lãnh đạo Cơ quan Hàng không vũ trụ Nhật Bản (JAXA) đã ký kết, trao đổi “Văn bản Sửa đổi thỏa thuận giữa Trung tâm Vũ trụ Việt Nam, Viện Hàn lâm Khoa học và Công nghệ Việt Nam với Cơ quan Hàng không vũ trụ Nhật Bản về trao đổi dữ liệu vệ tinh”.

Phối cảnh công trình biểu tượng bông lúa Cà Mau.

Giá trị văn hóa từ "Biểu tượng bông lúa" ở Cà Mau

Sự phát triển của một địa phương trong kỷ nguyên mới không chỉ được đong đếm một cách cơ học bằng những con đường rải nhựa, hay những cây cầu bê-tông nối nhịp đôi bờ. Tầm vóc và sức sống của một vùng đất còn được khắc họa đậm nét qua những biểu tượng văn hóa mang tầm nhìn chiến lược.

Đào tạo an ninh mạng tại CyRadar giúp doanh nghiệp nâng cao năng lực phòng thủ.

Tăng năng lực phòng vệ của doanh nghiệp

Chuyển đổi số đang mở ra nhiều cơ hội tăng trưởng cho doanh nghiệp Việt Nam nhưng cũng kéo theo những rủi ro an ninh mạng phức tạp. Khi dữ liệu trở thành tài sản chiến lược, khả năng bảo vệ hệ thống và thông tin không còn là vấn đề kỹ thuật mà trở thành năng lực phòng vệ quan trọng đối với mỗi doanh nghiệp.

Hoạt động nghiên cứu tại Phòng Thí nghiệm trọng điểm Công nghệ Lọc, Hóa dầu (Viện Hóa học công nghiệp Việt Nam).

Đầu tư hạ tầng nghiên cứu cho công nghệ chiến lược

Phát triển hệ thống phòng thí nghiệm trọng điểm quốc gia là một trong những giải pháp để hiện thực hóa mục tiêu đột phá về khoa học, công nghệ và đổi mới sáng tạo theo Nghị quyết 57-NQ/TW. Thực trạng lạc hậu về công nghệ đặt ra yêu cầu cấp thiết phải tổ chức lại hạ tầng nghiên cứu theo hướng tập trung, đồng bộ và hiệu quả.

Phòng An ninh mạng và phòng, chống tội phạm sử dụng công nghệ cao Công an thành phố Đà Nẵng đấu tranh tội phạm trên không gian mạng. (Ảnh: Công Vinh)

Nâng cao ý thức làm chủ, bảo vệ không gian mạng

Tại Hội nghị Trung ương 2 khóa XIV, Tổng Bí thư Tô Lâm tiếp tục khẳng định chủ trương của Đảng về bảo đảm quốc phòng, an ninh, đối ngoại, hội nhập quốc tế trong giai đoạn mới, khi nhấn mạnh yêu cầu: Tự chủ chiến lược, có năng lực kiểm soát rủi ro, có thể chế vững, có trật tự xã hội ổn định, có sự hội nhập quốc tế sâu rộng...

UAV được thử nghiệm phun thuốc cho cây cà-phê tại xã Mường Ảng, tỉnh Điện Biên.

Cơ chế sandbox đã sang giai đoạn triển khai thực tế

Bộ Khoa học và Công nghệ cho biết, bên cạnh chuẩn bị cấp phép mô hình thử nghiệm có kiểm soát đầu tiên về phát triển kinh tế tầm thấp, ứng dụng phương tiện bay không người lái (UAV) tại tỉnh Điện Biên, một số địa phương, doanh nghiệp cũng bày tỏ quan tâm đến việc triển khai thử nghiệm mô hình sandbox.

Định vị vị thế Việt Nam trên bản đồ sở hữu trí tuệ toàn cầu

Định vị vị thế Việt Nam trên bản đồ sở hữu trí tuệ toàn cầu

Trong tiến trình hội nhập kinh tế quốc tế, sở hữu trí tuệ ngày càng khẳng định vai trò là một trụ cột quan trọng của nền kinh tế tri thức. Những năm qua, Việt Nam đã chủ động hoàn thiện thể chế, từng bước xây dựng hệ thống sở hữu trí tuệ tương thích với chuẩn mực quốc tế và đạt được nhiều kết quả tích cực.

Bảo đảm pháp lý khi chuyển chất xám trí tuệ thành dòng vốn trên thị trường

Bảo đảm pháp lý khi chuyển chất xám trí tuệ thành dòng vốn trên thị trường

Luật Sở hữu trí tuệ sửa đổi 2025 được thông qua cho thấy những vấn đề pháp lý sở hữu trí tuệ đã được điều chỉnh gần và sát thực tiễn hiện nay. Trong đó, việc định giá tài sản sở hữu trí tuệ làm tài sản bảo đảm đang là nội dung thu hút sự quan tâm của đông đảo dư luận, nhất là với giới khởi nghiệp liên quan đổi mới sáng tạo.