Meta công khai mô hình ngôn ngữ lớn phục vụ nghiên cứu AI

NDO -

Mô hình ngôn ngữ lớn OPT-175B của Meta Platforms là mô hình ngôn ngữ với 175 tỷ tham số đầu tiên “mở cửa” miễn phí cho cộng đồng nghiên cứu trí tuệ nhân tạo (AI).

(Ảnh minh họa)
(Ảnh minh họa)

Ngày 3/5, công ty chủ quản của Facebook cho biết sẽ cấp quyền truy cập vào mô hình ngôn ngữ lớn của hãng - Open Pretrained Transformer (OPT-175B) - nhằm phục vụ nghiên cứu AI.

Quyền truy cập sẽ được cấp cho các nhà nghiên cứu hàn lâm, những người có liên kết với chính phủ, xã hội dân sự, các tổ chức học thuật, và các phòng thí nghiệm. Tài liệu tiếp cận sẽ bao gồm các mô hình được huấn luyện trước (pre-trained) cũng như mã để huấn luyện và sử dụng chúng.

Mô hình ngôn ngữ lớn là các hệ thống xử lý ngôn ngữ tự nhiên (NLP) - một nhánh nghiên cứu của AI - được huấn luyện dựa trên khối lượng văn bản khổng lồ và có khả năng trả lời các câu hỏi đọc hiểu hoặc tạo văn bản mới.

Meta cho biết, việc mở quyền truy cập mô hình OPT-175B sẽ giúp các nhà nghiên cứu hiểu thêm về cách thức hoạt động của các mô hình ngôn ngữ lớn.

Theo gã khổng lồ công nghệ Mỹ, việc hạn chế truy cập vào các mô hình này đã cản trở tiến bộ trong nỗ lực cải thiện sức mạnh của chúng và giảm nhẹ một số vấn đề đã được biết đến như sự thiên vị (về chủng tộc và giới tính) và các tác hại có thể lan truyền thông qua mô hình.

Bằng cách công khai OPT-175B, Meta hy vọng sẽ có thêm các luồng ý kiến đóng góp về mặt đạo đức cho công nghệ này.

Để tránh lạm dụng và duy trì tính toàn vẹn của mô hình, Meta sẽ chỉ công khai OPT-175B dưới dạng cấp phép phi thương mại nhằm tập trung vào các trường hợp sử dụng cho mục đích nghiên cứu.