Según un informe de la casa del webmaster del 22 de diciembre, Meta ha lanzado recientemente una serie de modelos de traducción de IA, que logran una latencia de conversión de voz en tiempo real de no más de 2 segundos, admiten traducciones a varios idiomas y tienen la capacidad de imitar características como el tono, la velocidad del habla y la emoción. Esta familia de modelos, denominada Seamless Communication, incluye SeamlessExpressive, SeamlessStreaming, SeamlessM4 T v2 y Seamless, los tres primeros de los cuales han sido de código abierto en GitHub. Para garantizar la precisión de la traducción y evitar abusos, Meta emplea tecnología de mitigación de toxicidad que filtra el "contenido tóxico" antes del entrenamiento y detecta y ajusta automáticamente las palabras tóxicas generadas durante la generación de la traducción, al tiempo que pone una marca de agua en el audio para rastrear la fuente. Para evitar el riesgo de abuso, Meta también ha añadido una marca de agua al audio, que permite rastrear con precisión la fuente del audio y combatir varios vectores de ataque incrustando una señal imperceptible en el audio.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Según un informe de la casa del webmaster del 22 de diciembre, Meta ha lanzado recientemente una serie de modelos de traducción de IA, que logran una latencia de conversión de voz en tiempo real de no más de 2 segundos, admiten traducciones a varios idiomas y tienen la capacidad de imitar características como el tono, la velocidad del habla y la emoción. Esta familia de modelos, denominada Seamless Communication, incluye SeamlessExpressive, SeamlessStreaming, SeamlessM4 T v2 y Seamless, los tres primeros de los cuales han sido de código abierto en GitHub. Para garantizar la precisión de la traducción y evitar abusos, Meta emplea tecnología de mitigación de toxicidad que filtra el "contenido tóxico" antes del entrenamiento y detecta y ajusta automáticamente las palabras tóxicas generadas durante la generación de la traducción, al tiempo que pone una marca de agua en el audio para rastrear la fuente. Para evitar el riesgo de abuso, Meta también ha añadido una marca de agua al audio, que permite rastrear con precisión la fuente del audio y combatir varios vectores de ataque incrustando una señal imperceptible en el audio.