🔥 Gate 動態大使專屬發帖福利任務第三期報名正式開啓!🏆 第二期獲獎名單將於6月3日公布!
👉️ 6月3日 — 6月8日期間每日發帖,根據帖子內容評級瓜分 $300獎池
報名即可參與:https://www.gate.com/zh/questionnaire/6761
報名時間:6月3日10:00 - 6月8日 24:00 UTC+8
🎁 獎勵詳情:
一、S級周度排名獎
S級:每週7日均完成發帖且整體帖子內容質量分數>90分可獲S級,挑選2名優質內容大使每人$50手續費返現券。
二、A/B 等級瓜分獎
根據各位動態大使發帖數量及帖子內容質量獲評等級,按評定等級獲獎:
A級:每週至少5日完成發帖且整體帖子內容質量90>分數>80可獲A級,從A級用戶中選出5名大使每人$20手續費返現券
B級:每週至少3日完成發帖且整體帖子內容質量80>分數>60可獲B級,從B級用戶中選出10名大使每人$10手續費返現券
📍 活動規則:
1.每週至少3日完成發帖才有機會獲獎。
2.根據發帖天數和整體發帖內容質量分數給予等級判定,分爲S/A/B等級,在各等級下選擇幸運大使獲獎。
💡 帖子評分標準:
1.每帖不少於30字。
2.內容需原創、有獨立見解,具備深度和邏輯性。
3.鼓勵發布市場行情、交易知識、幣種研究等主題,使用圖例或視頻可提高評分。
4.禁止發布FUD、抄襲或詆毀內容,違規將取
華為的大模型終於來了,我的評價是:相當震撼
原文來源:差評
老被人說在大模型競賽中掉隊的華為,這次終於帶著它的傢伙事兒來了。
這不,在昨天的華為開發者大會2023 上,華為就狠狠地秀了一把。
將近三個小時的發布會,還是繼承了華為以往大雜燴的風格,看得世超是眼花繚亂。
不過,總結下來其實也就突出了一個主題:盤古大模型3.0 。
最主要的是,它的預測精度甚至超過了號稱全球最強的歐洲氣象中心的IFS 系統,算是頭一個AI 預測贏了傳統數值預測的產品。
而且,之前的AI 模型會在預測的過程當中不斷累計迭代的誤差,容易影響到結果的精確性。
所以AI 預測方法一直都不咋受待見。
而盤古氣象大模型牛就牛在,他們用了個叫3DEST 的三維神經網絡來處理氣象數據, 2D 幹不了的那就換3D 來。
3DEST 的網絡訓練和推理策略
這詞兒雖然聽起來挺容易被唬住的,但其實很好理解。
就比如,之前的AI 氣象預測模型FourCastNet ,在颱風來之前,它會提前6 小時進行預測,在這6 個小時裡,模型會多次計算颱風到底啥時候來。
可能一會兒算出來5 個小時,一會兒又算出來4 個半小時,這些結果加到一起誤差就大了。
但盤古氣象大模型想了個法子,訓練了4 個不同預報間隔的模型,分別是1 小時迭代1 次,還有3 小時、 6 小時和24 小時迭代1 次。
再根據具體的氣象預測需求,選擇相應的模型進行迭代。
**迭代次數越少,誤差也就越小。 **
這波操作,讓天氣預報又邁向了一個新的level 。
不過,可能有差友開始犯嘀咕了,人家的大模型都是生成圖像和文字,怎麼到華為這就變成了天氣預報了?
有一說一啊,這盤古大模型跟咱之前接觸到的ChatGPT 、 Midjourney 的確不太一樣,人家做的是行業的生意。
它並不是**大家期待的ChatGPT“ 剋星” ,而是針對平時不太能接觸到的To B 市場。 **
咱先不提難與不難,至少華為這麼多年積累下來的企業客戶資源,確實很容易變現。
而且華為這次的發布會可不止帶來了氣象預測模型這一個狠角色。
40 多年都沒發現新的抗生素,盤古藥物分子大模型一來就找著了超級抗菌藥Drug X ,而且藥物的研發週期從數年縮短至幾個月,研發成本降低70% 。
要知道,一家年產1000 萬噸焦煤的選煤廠,每提升0.1% 精煤產率,每年就能多1000 萬的利潤。
**這可都是白花花的銀子啊。 。 。 **
事實上,除了上邊兒咱提到的天氣預測、藥物研發和選煤,盤古大模型在很多行業裡都已經用起來了。
而華為能夠量產這些各不相同的行業大模型,要歸功於華為盤古大模型3.0 的5+N+X 三層架構。
為什這麼說呢?
因為AI 落地行業,數據是一大難點。
張平安在發布會上就說, “ 由於行業數據獲取難,技術與行業結合難,大模型在行業的落地進展較慢。 ”
**而盤古則很巧妙,通過5+N+X 的三層架構,直接把這個大難題拆成了3 個小問題來解決。 **
首先,是先讓盤古L0 層的5 個大模型,學習了上百TB 的百科知識、文學作品、程序代碼等文本數據,以及數10 億張帶文本標籤的互聯網圖像。
然後,在第二層L1 中的模型,則是讓L0 中的某一個基礎大模型學習N 個相關行業的數據形成的。這就像大學的本科階段,需要選擇各種專業去學習。
但畢竟一個是醫院,一個是工廠,使用場景完全不一樣,光靠基礎大模型那肯定行不通,但如果把行業數據加進去,可能就有驚喜了。
與此同時呢,華為還在裡頭加入一個反饋環節,有點進公司實習內味了。
根據他們的說法,過去開發一個GPT-3 規模的行業大模型,通常需要5 個月;而有了這套東西,開發週期能縮短至原來的1/5 。
同時很多行業數據集小的限制也能被解決。比如造大飛機這種很細很細的行業,也能有大模型。
眾所周知,咱們在AI 算力方面,確實是比較尷尬。
一來, AI 行業的核心設備英偉達的H100/A100 咱們買不到,二來,即使英偉達“ 貼心” 出了平替H800 ,但是也有所保留。比如,在傳輸速率上就砍了不少。
在大模型動輒幾個月訓練時間的背景之下,這就很容易被算力更強的國外同行彎道超車。
而這一回,針對這個問題,華為還是掏了些真傢伙出來的。
不過實際應用起來,還是有一些差距的。而且A100 這也不是英偉達的終極武器。
比如,根据发布会的说法,算上 AI 昇腾云算力底座、计算框架 CANN 。。。等环节,华为在训练大模型方面,效率是业界主流 GPU 的 1.1 倍。
還是挺可觀的。
而且華為還說,他們現在有近400 萬的開發者,這個數量,是和英偉達CUDA 生態對齊了。
**總的來說,一場華為發布會看下來,**差評君覺得華為在AI 方面的佈局是很深刻的,他們早就開始思考“AI 真正能帶給我們什麼” 這個問題了。
過去半年裡, AI 行業雖然掌聲雷動,但是真正落到行業層面,多少有些尷尬。
而華為的這一次動作,恰好印證瞭如任正非說的:
“ 未來在AI 大模型方面會風起雲湧的,不只是微軟一家。人工智能軟件平台公司對人類社會的直接貢獻可能不到2% , 98% 都是對工業社會、農業社會的促進。 ”
AI 領域,真正的大時代還在後頭。