De acordo com um relatório da casa do webmaster em 22 de dezembro, a Meta lançou recentemente uma série de modelos de tradução de IA, que alcançam latência de conversão de voz em tempo real de não mais de 2 segundos, suportam traduções em vários idiomas e têm a capacidade de imitar características como tom, velocidade de fala e emoção. Esta família de modelos, chamada Seamless Communication, inclui SeamlessExpressive, SeamlessStreaming, SeamlessM4 T v2 e Seamless, os três primeiros dos quais foram de código aberto no GitHub. Para garantir a precisão da tradução e evitar abusos, a Meta emprega tecnologia de mitigação de toxicidade que filtra o "conteúdo tóxico" antes do treinamento e deteta e ajusta automaticamente as palavras tóxicas geradas durante a geração da tradução, enquanto marca o áudio para rastrear a fonte. Para evitar o risco de abuso, a Meta também adicionou uma marca d'água ao áudio, que permite rastrear com precisão a fonte do áudio e combater vários vetores de ataque, incorporando um sinal impercetível no áudio.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
De acordo com um relatório da casa do webmaster em 22 de dezembro, a Meta lançou recentemente uma série de modelos de tradução de IA, que alcançam latência de conversão de voz em tempo real de não mais de 2 segundos, suportam traduções em vários idiomas e têm a capacidade de imitar características como tom, velocidade de fala e emoção. Esta família de modelos, chamada Seamless Communication, inclui SeamlessExpressive, SeamlessStreaming, SeamlessM4 T v2 e Seamless, os três primeiros dos quais foram de código aberto no GitHub. Para garantir a precisão da tradução e evitar abusos, a Meta emprega tecnologia de mitigação de toxicidade que filtra o "conteúdo tóxico" antes do treinamento e deteta e ajusta automaticamente as palavras tóxicas geradas durante a geração da tradução, enquanto marca o áudio para rastrear a fonte. Para evitar o risco de abuso, a Meta também adicionou uma marca d'água ao áudio, que permite rastrear com precisão a fonte do áudio e combater vários vetores de ataque, incorporando um sinal impercetível no áudio.