Theo báo cáo của nhà quản trị web hôm 22/12, Meta mới đây đã phát hành một loạt mô hình dịch AI, đạt được độ trễ chuyển đổi giọng nói theo thời gian thực không quá 2 giây, hỗ trợ dịch nhiều ngôn ngữ và có khả năng bắt chước các đặc điểm như giọng điệu, tốc độ giọng nói và cảm xúc. Họ mô hình này, được gọi là Giao tiếp liền mạch, bao gồm SeamlessExpressive, SeamlessStreaming, SeamlessM4 T v2 và Seamless, ba mô hình đầu tiên đã được mã nguồn mở trên GitHub. Để đảm bảo tính chính xác của bản dịch và tránh lạm dụng, Meta sử dụng công nghệ giảm thiểu độc tính để lọc ra "nội dung độc hại" trước khi đào tạo và tự động phát hiện và điều chỉnh các từ độc hại được tạo ra trong quá trình tạo bản dịch, đồng thời đánh dấu âm thanh để theo dõi nguồn. Để ngăn chặn nguy cơ lạm dụng, Meta cũng đã thêm hình mờ vào âm thanh, cho phép bạn theo dõi chính xác nguồn âm thanh và chống lại các vectơ tấn công khác nhau bằng cách nhúng tín hiệu không thể nhận ra vào âm thanh.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Theo báo cáo của nhà quản trị web hôm 22/12, Meta mới đây đã phát hành một loạt mô hình dịch AI, đạt được độ trễ chuyển đổi giọng nói theo thời gian thực không quá 2 giây, hỗ trợ dịch nhiều ngôn ngữ và có khả năng bắt chước các đặc điểm như giọng điệu, tốc độ giọng nói và cảm xúc. Họ mô hình này, được gọi là Giao tiếp liền mạch, bao gồm SeamlessExpressive, SeamlessStreaming, SeamlessM4 T v2 và Seamless, ba mô hình đầu tiên đã được mã nguồn mở trên GitHub. Để đảm bảo tính chính xác của bản dịch và tránh lạm dụng, Meta sử dụng công nghệ giảm thiểu độc tính để lọc ra "nội dung độc hại" trước khi đào tạo và tự động phát hiện và điều chỉnh các từ độc hại được tạo ra trong quá trình tạo bản dịch, đồng thời đánh dấu âm thanh để theo dõi nguồn. Để ngăn chặn nguy cơ lạm dụng, Meta cũng đã thêm hình mờ vào âm thanh, cho phép bạn theo dõi chính xác nguồn âm thanh và chống lại các vectơ tấn công khác nhau bằng cách nhúng tín hiệu không thể nhận ra vào âm thanh.