Công bố gây bão
Cuối tháng 1 vừa qua, Deepseek đã phát hành ứng dụng chatbot miễn phí đầu tiên dựa trên một mô hình mới có tên là DeepSeek-V3. Chatbot là trợ lý ảo dựa trên AI được thiết kế để tương tác với người dùng bằng ngôn ngữ tự nhiên, mô phỏng các cuộc trò chuyện giống con người. Ngay sau khi DeepSeek giới thiệu DeepSeek-V3, năng lực của chatbot này đã được đánh giá sánh ngang các chatbot tốt nhất từ các công ty Mỹ như OpenAI và Google.
Đáng nói, trong một bài báo khoa học giải thích cách xây dựng công nghệ AI, DeepSeek tiết lộ công ty chỉ sử dụng một lượng nhỏ chip máy tính so lượng chip khổng lồ mà các công ty AI hàng đầu ở Mỹ sử dụng để đào tạo hệ thống của họ. Cụ thể, các công ty hàng đầu thế giới thường đào tạo chatbot của họ bằng siêu máy tính sử dụng tới 16.000 con chip hoặc hơn thế. Tuy nhiên, các kỹ sư của DeepSeek cho biết, họ chỉ cần sử dụng khoảng 2.000 chip đời cũ do Nvidia sản xuất.
Không chỉ vậy, DeepSeek gây xôn xao khi tiết lộ mô hình mới “được đào tạo trên các chip cũ của Nvidia, mã nguồn mở 100%, rẻ hơn 96,4% so OpenAI trong khi vẫn mang lại hiệu suất tương tự”. Công ty cho biết, họ chỉ mất hai tháng và chi phí dưới 6 triệu USD để xây dựng mô hình AI sử dụng chip H800 kém tiên tiến của Nvidia. Trong khi đó, các nhà phát triển tại những công ty AI hàng đầu của Mỹ ước tính tổng chi phí thực tế có thể cao hơn gấp nhiều lần. Phiên bản V3 thậm chí vượt ChatGPT trở thành ứng dụng được tải nhiều nhất trên App Store tại Mỹ ngày 27/1.
Điều này đã dẫn đến sự sụt giảm mạnh trong giá cổ phiếu của Nvidia, nhà sản xuất chip AI và các công ty khác. Trên thực tế, cổ phiếu lao dốc đã thổi bay 17% trị giá vốn hóa của Nvidia, tương đương 600 tỷ USD.
Ngay sau màn ra mắt “gây bão” của DeepSeek, Tổng thống Mỹ Donald Trump cho biết, sự trỗi dậy đột ngột này “nên là lời cảnh tỉnh” đối với các công ty công nghệ của Mỹ. “Việc phát hành DeepSeek nên là lời cảnh tỉnh cho ngành công nghiệp của chúng ta, rằng chúng ta cần tập trung cao độ vào việc cạnh tranh”, ông Trump nói trong chuyến đi công tác ở Florida (Mỹ) ngày 27/1.
Tổng thống Mỹ vẫn kỳ vọng các công ty công nghệ Mỹ tiếp tục thống trị trong lĩnh vực AI, song thừa nhận thách thức mà DeepSeek đặt ra. Ông cũng nhận định mô hình chi phí thấp là “bước phát triển rất tích cực” đối với lĩnh vực AI nói chung trên thế giới.
![]() |
Giới thiệu dự án Stargate tại Mỹ. Ảnh: AP |
Cạnh tranh toàn cầu
Sự xuất hiện của DeepSeek đánh dấu một bước ngoặt quan trọng trong cuộc đua AI toàn cầu, mở ra cơ hội cho việc phát triển AI hiệu quả với chi phí thấp hơn, đồng thời đặt ra thách thức mới cho các công ty công nghệ lớn. Ngay sau khi tuyên thệ nhậm chức Tổng thống Mỹ nhiệm kỳ thứ hai, ông Trump đã công bố một dự án trị giá 500 tỷ USD nhằm xây dựng cơ sở hạ tầng cho ngành AI, tăng cường sức mạnh công nghệ của Mỹ để cạnh tranh với sự trỗi dậy mạnh mẽ từ Trung Quốc, đặc biệt khi nước này liên tục đầu tư mạnh tay vào các lĩnh vực AI, công nghệ 5G và dữ liệu lớn.
Dự án mới có tên “Stargate” sẽ được dẫn dắt bởi SoftBank của Nhật Bản và OpenAI, công ty đứng sau ChatGPT. Dự kiến, Stargate bắt đầu bằng việc xây dựng trung tâm dữ liệu đầu tiên tại Texas (Mỹ). Theo Business Insider, hai tòa nhà đầu tiên ở khuôn viên trung tâm của Stargate đã bắt đầu được thi công và dự kiến trung tâm dữ liệu đầu tiên có thể hoàn thành cuối năm nay.
Ngày 3/2, OpenAI đã chính thức phát hành công khai mô hình AI o3-mini. Đây là mô hình lý luận đầu tiên của OpenAI không yêu cầu đăng ký, tức sẽ cho phép người dùng sử dụng miễn phí. Mô hình o3-mini được thiết kế để cung cấp độ chính xác cao hơn so các mô hình ngôn ngữ lớn (LLM) thông thường. Nó sử dụng hệ thống “chuỗi suy nghĩ” để “suy nghĩ” trước khi đưa ra câu trả lời và tự sửa lỗi, điều này khiến nó trở thành lựa chọn lý tưởng cho các câu hỏi khó, đặc biệt là trong lĩnh vực toán học. Quan trọng, chi phí sử dụng o3-mini chỉ là 1,1 USD cho một triệu token (một dạng chữ ký số hay chữ ký điện tử) đầu vào, chỉ bằng một nửa so o1-mini. Đây được coi là một bước nhảy vọt về hiệu quả và được ghi nhận là một thành tựu lớn trong bối cảnh sự phát triển của DeepSeek.
Trong khi đó, Tập đoàn Google ngày 5/2 thông báo các bản cập nhật cho mô hình ngôn ngữ lớn Gemini, trong đó có một dòng sản phẩm mới với mức giá cạnh tranh với các mô hình AI giá rẻ. Google hiện cung cấp nhiều phiên bản Gemini với các mức giá và hiệu năng khác nhau. Bên cạnh phiên bản Flash gọn nhẹ đã có, hãng tiếp tục giới thiệu Flash-Lite với chi phí thậm chí còn thấp hơn nữa. Ước tính, chi phí cho một số đầu vào trên Gemini Flash-Lite là 0,019 USD cho một triệu token. Con số này được so sánh với mức 0,075 USD trên phiên bản tiết kiệm chi phí của mô hình hàng đầu từ OpenAI và 0,014 USD trên mô hình giá rẻ của DeepSeek.
Theo CNN, ngoài Mỹ và Trung Quốc, một số quốc gia khác như Ấn Độ, Hàn Quốc... cũng bắt đầu tham gia phát triển chatbot AI giá rẻ. Điển hình tại Ấn Độ, Công ty Reliance Jio của tỷ phú Mukesh Ambani đã ra mắt chatbot AI đầu tiên hỗ trợ ngôn ngữ địa phương có tên BharatGPT. Đây là bước tiến đáng kể trong lĩnh vực AI của Ấn Độ, giúp công nghệ tiếp cận nhóm dân số không nói tiếng Anh dễ dàng hơn.
Ngày 6/2 vừa qua, Bộ trưởng Đường sắt, Truyền thông, Điện tử và Công nghệ thông tin Ấn Độ Ashwini Vaishnaw và Tổng Giám đốc điều hành (CEO) Open AI, Sam Altman, đã có cuộc gặp để cùng thảo luận về kế hoạch phát triển hệ sinh thái AI toàn diện với chi phí thấp của Ấn Độ. CEO của Open AI bày tỏ sự ngưỡng mộ với tốc độ ứng dụng công nghệ trí tuệ nhân tạo và tham vọng ngày càng lớn của Ấn Độ. Ấn Độ hiện là thị trường lớn thứ hai của OpenAI, với số lượng người dùng đã tăng gấp ba lần trong năm qua. CEO Altman tin rằng, Ấn Độ có thể trở thành một trong những quốc gia dẫn đầu trong cuộc cách mạng AI với chi phí thấp.
Bộ trưởng Ashwini Vaishnaw cho biết, quốc gia đông dân nhất thế giới đang phát triển một loạt mô hình AI cơ bản của riêng mình. Mô hình này sẽ hoạt động tương tự như DeepSeek và ChatGPT, với chi phí phát triển và vận hành thấp. Ông Ashwini cho biết, mô hình AI của Chính phủ Ấn Độ đang được phát triển với cơ sở hạ tầng tính toán sử dụng khoảng 18.000 chip. Đáng chú ý, một mô hình AI phổ biến như ChatGPT có chi phí sử dụng khoảng 3 USD mỗi giờ, nhưng mô hình AI của Ấn Độ có thể chỉ tốn 100 rupee (khoảng 1,15 USD) nhờ chính sách trợ giá từ chính phủ. Dự kiến, mô hình AI mới này của Ấn Độ sẽ được ra mắt trong vòng 8 đến 10 tháng tới.
Giới phân tích cho rằng, việc DeepSeek được công bố những ngày qua đang tạo ra cơ hội cho việc cạnh tranh tạo ra các mô hình AI giá rẻ trên khắp thế giới, thay vì chỉ phụ thuộc vào các “ông lớn” công nghệ như trước đây.