26 Eylül tarihli bir Pinwan raporuna göre HuggingFace sayfası, Microsoft DeepSpeed'in yakın zamanda çok modlu işlevleri entegre ederek büyük dil modellerinin yeteneklerini optimize etmeyi amaçlayan DeepSpeed-VisualChat adlı bir çerçeveyi duyurduğunu gösteriyor. Makaleye göre DeepSpeed-VisualChat, büyük dil modellerinin aralıklı girdiyi işleme konusundaki yeterliliğini geliştirmeye odaklanıyor. Bu amaçla çerçeve, çok turlu, çok görüntülü konuşmalarda kusursuz etkileşimler sağlamak için mevcut veri kümeleri üzerinde veri harmanlama tekniklerinden yararlanan yenilikçi çok modlu nedensel dikkat mekanizmasını tanıtıyor. Mevcut çerçevelerle karşılaştırıldığında DeepSpeed-VisualChat, 70B parametre dili modeli boyutuna kadar mükemmel ölçeklenebilirlik gösterir.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
26 Eylül tarihli bir Pinwan raporuna göre HuggingFace sayfası, Microsoft DeepSpeed'in yakın zamanda çok modlu işlevleri entegre ederek büyük dil modellerinin yeteneklerini optimize etmeyi amaçlayan DeepSpeed-VisualChat adlı bir çerçeveyi duyurduğunu gösteriyor. Makaleye göre DeepSpeed-VisualChat, büyük dil modellerinin aralıklı girdiyi işleme konusundaki yeterliliğini geliştirmeye odaklanıyor. Bu amaçla çerçeve, çok turlu, çok görüntülü konuşmalarda kusursuz etkileşimler sağlamak için mevcut veri kümeleri üzerinde veri harmanlama tekniklerinden yararlanan yenilikçi çok modlu nedensel dikkat mekanizmasını tanıtıyor. Mevcut çerçevelerle karşılaştırıldığında DeepSpeed-VisualChat, 70B parametre dili modeli boyutuna kadar mükemmel ölçeklenebilirlik gösterir.