DailyNews
vip

12月22日のウェブマスターの自宅のレポートによると、Metaは最近、2秒以内のリアルタイム音声変換遅延を実現し、複数の言語翻訳をサポートし、トーン、スピーチ速度、感情などの特性を模倣する機能を備えた一連のAI翻訳モデルをリリースしました。 Seamless Communicationと呼ばれるこのモデルファミリーには、SeamlessExpressive、SeamlessStreaming、SeamlessM4 T v2、Seamlessが含まれ、最初の3つはGitHubでオープンソース化されています。 翻訳の正確性を確保し、悪用を回避するために、Metaは、トレーニング前に「有害コンテンツ」を除外し、翻訳生成中に生成された有害単語を自動的に検出して調整し、音声に透かしを入れてソースを追跡する有害性軽減技術を採用しています。 悪用のリスクを防ぐために、Metaはオーディオに透かしを追加し、オーディオに知覚できない信号を埋め込むことで、オーディオのソースを正確に追跡し、さまざまな攻撃ベクトルに対抗できるようにしました。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)