據《科創板日報》報導,阿里雲今日推出大規模視覺語言模型Qwen-VL,並對其直接開源。 Qwen-VL 以通義千問70 億參數模型Qwen-7B 為基座語言模型研發,支持圖文輸入。相較於此前的VL 模型,Qwen-VL 除了具備基本的圖文識別、描述、問答及對話能力之外,還新增了視覺定位、圖像中文字理解等能力,可用於知識問答、圖像標題生成、圖像問答、文檔問答、細粒度視覺定位等場景。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)