“千模大戰”熱潮下的AI冷思考

原文來源:國際金融報

2023世界人工智能大會雖然已經閉幕,但由ChatGPT掀起的大模型熱潮還將繼續湧動,人工智能的佈局和探索也將是近些年的一大主題。 “先上牌桌”“搶下先手棋”是掀起這一輪“百模大戰”熱潮的行業共識,並引導行業跨入“千模大戰”。

圖片來源:由無界AI‌ 生成

7月初申城人工智能熱潮湧動,**2023世界人工智能大會無論參展企業數量還是展覽面積均創歷屆之最,多家企業在會上宣布將發布AI大模型。 **高溫、強對流天氣都沒能沖散大家的熱情,展會門口一度引來黃牛售票,不少人扶老攜幼一探人工智能發展前沿趨勢。

熱潮下,**也應該冷靜看到大模型仍面臨魯棒性、合規可信等核心問題。 **與發達國家相比,我國在芯片、算力、數據等方面仍有差距,數據稀缺是影響大模型應用落地的一大難題,其中高質量的中文語料數據獲取難度大是製約國內大模型發展的一大因素。

在核心問題尚待突破、差距正在彌合的現階段,中國的AI發展要探索一條怎樣的發展路徑?在三天論壇和對現場多位參會行業專家的採訪中,記者得到的最多答案是“垂直整合”“落地應用”,在垂直領域率先嘗試應用起來,構建組合式AI系統是近些年國內AI發展趨勢。

“先上牌桌”

當前,發展數字經濟已成為全球共識。人工智能作為一種戰略性新興技術,正日益成為產業升級和生產力提升的核心驅動力。 2022年11月,OpenAI推出對話式通用人工智能大模型ChatGPT,全球新一輪AI創新熱潮隨之掀起,國內多個人工智能大模型相繼推出并快速迭代。

**在2023世界人工智能大會上,大模型是當仁不讓的主角。 **百度文心一言、阿里云通義千問、華為雲盤古、訊飛星火、商湯日日新、瀾舟孟子MChat、星環無涯Transwarp Infinity、蜜度蜜巢系列、拓爾思拓天、達觀“曹植”等通用和垂直大模型讓人目不暇接。

薩摩耶雲科技集團創始人、董事長林建明在會場接受《國際金融報》記者採訪時指出,**AI正處於新一輪產業趨勢的起點。 **從大模型的佈局來看,百度、阿里、華為等“高端玩家”從算力層、平台層、模型層、應用層進行“四位一體”佈局;科研院校及初創科技公司另闢蹊徑,以研發大模型算法及細分領域應用為切入口。

林建明表示,**目前國內大模型參數基本都處於千億及以上規模,應用方向看,大部分企業前期以內部應用為主,逐漸向B端企業進行延伸。 **人工智能技術不斷取得突破,大廠和中小科技公司競相逐鹿大模型,自然誰都不願錯過這個時代大浪潮。只有“先上牌桌”,才能抓住規則這張“王牌”。而在移動互聯網紅利消退的背景下,選擇擁抱大模型,有望帶來新的增長點。

IEEE/CAAI Fellow、清華大學惠妍講席教授、電子係長聘教授、銜遠科技創始人周伯文告訴《國際金融報》記者,**中國應走通基於“自主創新、安全可控”的大語言模型與生成式人工智能技術發展路線,著力推動具備通用能力的大模型在垂直行業的廣泛應用落地。 **此外,商業應用、學術創新和技術生態都需要多元化,不能完全集中在一個大模型之上,也不應都用一種思路去做事情。

多重挑戰

AI熱潮下,大模型仍面臨魯棒性、合規可信等多重挑戰。林建明直言,**和國際上比尤其是對標美國,我們在AI芯片、專利、算法研究、成熟的創新生態系統等方面仍存在一定差距。 **現在製約國內大模型發展的主要在於:一是大模型需要大算力,我們在芯片及算力方面存在短板;二是缺乏高質量的中文語料數據和行業數據;三是專業人員數量稀少,基礎研究創新力不夠。

“金融業是個特殊的存在,對風險管理和安全性要求非常高。研發金融大模型面臨的信任風險、模型風險、倫理、穩定性、準確性、數據安全、合規性等風險的挑戰更加嚴峻。”林建明指出。

馬上消費副總經理、首席信息官蔣寧在接受《國際金融報》記者採訪時表示,**AI大模型仍面臨在關鍵決策上的動態適應性、魯棒性、合規可信等核心問題,如何排除噪音以及乾擾性問題,在突發和不可預期情況下,實現關鍵決策的持續穩定和合規可信尤其關鍵。 **

蔣寧指出,國內大模型缺乏原創性突破,模型推理能力、大模型生成能力仍有差距。大規模、高質量的中文語料數據獲取難度大是製約國內大模型發展的一大因素。具體到金融領域,其還面臨隱私保護、持續穩定、合規可信等多方面的挑戰。

周伯文認為,當前AI大模型的訓練,算法端向神經網絡Transformer模型收斂,算力端依賴具備大規模並行計算能力的AI服務器集群,數據端則需要巨大數據量的大規模數據集投餵,如果從AI三要素來看,數據稀缺性明顯是導致大模型應用落地的一大難題。諸如金融行業這類對數據安全和用戶隱私保護要求極其嚴格的特定領域,也向大模型提出了可信賴、自主可控與強安全等一系列挑戰。

周伯文表示,**大模型產業化也面臨挑戰:一是數據規模大,且數據質量參差不齊;二是模型的體積大,訓練難度很高;三是算力規模大,性能要求高。 **因此,大模型研發依賴算法算力和數據的綜合支撐。大模型是未來產業發展的重點,但大模型的商業模式值得探討。因為大模型的成本壁壘非常高,大公司和小企業都有各自的負擔。

垂直整合

在核心問題尚待突破、差距正在彌合的現階段,中國的AI發展要探索一條怎樣的發展路徑?還有哪些發展機遇?蔣寧指出,構建組合式AI系統是發展趨勢,有效結合各種垂直領域的辨別式模型的可用性和專業性,以及生成式大模型的遷移學習和泛化能力強的特點,從而在工業界真正發揮大模型的泛化能力優勢。

林建明指出,大模型未來在城市、行業、企業等千行百業數智化過程中大有可為。國內佈局大模型要加強自主創新能力,從算力、算法、人才等各個層面提升大模型的核心競爭力,還要緊密結合國家戰略需求和行業發展方向,深入探索行業痛點和場景。

此外,“要發揮自身技術、場景、用戶和行業數據及行業Know-How(行業秘訣)打造垂直領域大模型;以'通用模型+行業Know-How專用模型'為實體經濟賦能,建立自身壁壘優勢。”林建明表示。

周伯文認為,**大模型產業應從端到端做起,慢慢迭代出更大的商業模型,或許是更適合的做法。在具備通用能力的基礎之上,於垂直領域不斷訓練、提升大模型的專業能力,是未來幫助大模型這項技術發展進步的一種重要手段。 **

周伯文指出,從理論、技術層面來看,差異一定是存在的。在AI的發展上,一方面我們是技術層面的追趕者,另一方面我們也很可能成為應用層面的創新者甚至引領者。 **中國的AI需要探索一條新的道路,即垂直整合從自研通用大模型到應用、用戶全場景閉環,實現生成式人工智能技術與商業價值“雙落地”。 **

對於創業競爭,周伯文認為,可以分成三條路線看待:第一條路線是自己做具備通用能力的底層大模型,從技術算法到模型迭代、場景閉環都具備;第二條路線是基於別人的模型(如GPT),然後結合自己的行業Know-how去做訓練;第三條路線是純粹做應用,是將模型拿來直接使用,這種壁壘會較低。

查看原文
本頁面內容僅供參考,非招攬或要約,也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)