Công ty mẹ của Facebook, Meta Platforms vừa ra mắt mô hình AI-SeamlessM4T. Nó có thể hỗ trợ dịch các văn bản viết và văn bản nói ra gần 100 ngôn ngữ. Đây là sự kết hợp công nghệ mà trước đây chỉ có trong các mô hình riêng biệt.
Trong một bài đăng trên blog, Công ty cho biết SeamlessM4T có thể hỗ trợ dịch giữa văn bản và lời nói trong gần 100 ngôn ngữ, cũng như dịch toàn bộ các cuộc hội thoại bằng 35 ngôn ngữ.
CEO Mark Zuckerberg cho biết những công cụ như vậy tạo điều kiện thuận lợi cho sự tương tác giữa người dùng trên toàn cầu trong metaverse (thế giới ảo). Bài đăng trên blog cho biết Meta đang cung cấp mô hình này miễn phí.
Công ty truyền thông xã hội lớn nhất thế giới đã phát hành một loạt mô hình AI hầu hết miễn phí trong năm nay, bao gồm mô hình ngôn ngữ đàm thoại lớn Llama. Điều này đặt ra thách thức nghiêm trọng đối với các mô hình độc quyền được bán bởi OpenAI do Microsoft hậu thuẫn và Google của Alphabet.
Zuckerberg cho biết hệ sinh thái AI mở mang lại lợi ích cho Meta, vì công ty có thể đạt được nhiều lợi ích hơn bằng cách huy động nguồn lực từ cộng đồng để tạo ra các công cụ hướng tới người tiêu dùng hơn là tính phí truy cập vào các mô hình.
Tuy nhiên, Meta phải đối mặt với các câu hỏi pháp lý tương tự như phần còn lại của ngành này xung quanh dữ liệu được sử dụng để huấn luyện các mô hình AI của mình, như thông tin cá nhân, thông tin bản quyền và thông tin báo chí.
Đối với mô hình SeamlessM4T, các nhà nghiên cứu của Meta cho biết họ đã thu thập dữ liệu đào tạo âm thanh từ 4 triệu giờ "âm thanh thô của kho lưu trữ dữ liệu web có sẵn công khai ". Họ không nói rõ là kho lưu trữ nào. Người phát ngôn của Meta không trả lời các câu hỏi về nguồn gốc của dữ liệu âm thanh. Dữ liệu văn bản đến từ các bộ dữ liệu được tạo ra vào năm ngoái, lấy nội dung từ Wikipedia và các trang web liên kết, theo tài liệu nghiên cứu.