Selon un rapport de la maison du webmaster du 22 décembre, Meta a récemment publié une série de modèles de traduction IA, qui atteignent une latence de conversion vocale en temps réel ne dépassant pas 2 secondes, prennent en charge les traductions en plusieurs langues et ont la capacité d’imiter des caractéristiques telles que le ton, la vitesse de la parole et l’émotion. Cette famille de modèles, appelée Seamless Communication, comprend SeamlessExpressive, SeamlessStreaming, SeamlessM4 T v2 et Seamless, dont les trois premiers ont été open source sur GitHub. Pour garantir l’exactitude de la traduction et éviter les abus, Meta utilise une technologie d’atténuation de la toxicité qui filtre le « contenu toxique » avant l’entraînement et détecte et ajuste automatiquement les mots toxiques générés lors de la génération de la traduction, tout en filigranant l’audio pour retracer la source. Pour éviter tout risque d’abus, Meta a également ajouté un filigrane à l’audio, ce qui vous permet de retracer avec précision la source de l’audio et de lutter contre divers vecteurs d’attaque en intégrant un signal imperceptible dans l’audio.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Selon un rapport de la maison du webmaster du 22 décembre, Meta a récemment publié une série de modèles de traduction IA, qui atteignent une latence de conversion vocale en temps réel ne dépassant pas 2 secondes, prennent en charge les traductions en plusieurs langues et ont la capacité d’imiter des caractéristiques telles que le ton, la vitesse de la parole et l’émotion. Cette famille de modèles, appelée Seamless Communication, comprend SeamlessExpressive, SeamlessStreaming, SeamlessM4 T v2 et Seamless, dont les trois premiers ont été open source sur GitHub. Pour garantir l’exactitude de la traduction et éviter les abus, Meta utilise une technologie d’atténuation de la toxicité qui filtre le « contenu toxique » avant l’entraînement et détecte et ajuste automatiquement les mots toxiques générés lors de la génération de la traduction, tout en filigranant l’audio pour retracer la source. Pour éviter tout risque d’abus, Meta a également ajouté un filigrane à l’audio, ce qui vous permet de retracer avec précision la source de l’audio et de lutter contre divers vecteurs d’attaque en intégrant un signal imperceptible dans l’audio.