26 Eylül tarihli bir Pinwan raporuna göre HuggingFace sayfası, Microsoft DeepSpeed'in yakın zamanda çok modlu işlevleri entegre ederek büyük dil modellerinin yeteneklerini optimize etmeyi amaçlayan DeepSpeed-VisualChat adlı bir çerçeveyi duyurduğunu gösteriyor. Makaleye göre DeepSpeed-VisualChat, büyük dil modellerinin aralıklı girdiyi işleme konusundaki yeterliliğini geliştirmeye odaklanıyor. Bu amaçla çerçeve, çok turlu, çok görüntülü konuşmalarda kusursuz etkileşimler sağlamak için mevcut veri kümeleri üzerinde veri harmanlama tekniklerinden yararlanan yenilikçi çok modlu nedensel dikkat mekanizmasını tanıtıyor. Mevcut çerçevelerle karşılaştırıldığında DeepSpeed-VisualChat, 70B parametre dili modeli boyutuna kadar mükemmel ölçeklenebilirlik gösterir.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)