🔥 Gate 動態大使專屬發帖福利任務第三期報名正式開啓!🏆 第二期獲獎名單將於6月3日公布!
👉️ 6月3日 — 6月8日期間每日發帖,根據帖子內容評級瓜分 $300獎池
報名即可參與:https://www.gate.com/zh/questionnaire/6761
報名時間:6月3日10:00 - 6月8日 24:00 UTC+8
🎁 獎勵詳情:
一、S級周度排名獎
S級:每週7日均完成發帖且整體帖子內容質量分數>90分可獲S級,挑選2名優質內容大使每人$50手續費返現券。
二、A/B 等級瓜分獎
根據各位動態大使發帖數量及帖子內容質量獲評等級,按評定等級獲獎:
A級:每週至少5日完成發帖且整體帖子內容質量90>分數>80可獲A級,從A級用戶中選出5名大使每人$20手續費返現券
B級:每週至少3日完成發帖且整體帖子內容質量80>分數>60可獲B級,從B級用戶中選出10名大使每人$10手續費返現券
📍 活動規則:
1.每週至少3日完成發帖才有機會獲獎。
2.根據發帖天數和整體發帖內容質量分數給予等級判定,分爲S/A/B等級,在各等級下選擇幸運大使獲獎。
💡 帖子評分標準:
1.每帖不少於30字。
2.內容需原創、有獨立見解,具備深度和邏輯性。
3.鼓勵發布市場行情、交易知識、幣種研究等主題,使用圖例或視頻可提高評分。
4.禁止發布FUD、抄襲或詆毀內容,違規將取
思想克隆!前OpenAI研究員讓AI模仿人類思維,現實版「機械姬」降臨
**來源:**新智元
導讀:我們離「機械姬」還有多遠?前OpenAI研究員讓AI克隆思想,模仿人類思維,邊思考邊行動。
當AI有了自主意識會如何?
「機械姬」中,艾娃利用人類的同情心,以欺騙的方式誘導人類獲得自由,最終殺了自己的「造物主」Nathan。
並表示,「很好的電影,但我不明白為什麼每個人都讓我看它。」
但我們離「機械姬」上映的那一幕還很遙遠,GPT-5可能在秘密研發中,讓AI有智慧仍是科學家集洪荒之力最想做的事。
最新論文中,他們研究了智能體的「思想克隆」(TC)。
這裡,人工智能通過模仿人類,學會像人類一樣「思考」和「行動」。
當AI有了思想
要知道,語言是區分人類和其他生物的關鍵。
因此,研究人員設想,如果智能體能夠理解語言,便會有很多的好處。
儘管有這些益處,但AI智能體卻很少思考,至少不是用人類語言去思考。
雖然神經網絡可以被認為是思考的內部向量激活,但許多人假設,以離散的、符號的語言進行思考具有特定的好處。
這意味著能夠用語言思考的智能體,可能比不用語言的智能體學習得更快,表現、概括得更好。
Jeff Clune和Shengran Hu認為實現這一目標的最有效的方法是「讓AI模仿人類思考」。
因此,一個有效的方法是,讓智能體從人類在行動時把想法說出的演示中進行學習。
這一方法不同於現有的用預訓練LLMs進行規劃的工作,因為這些LLMs沒有受過人類在行動時說出想法的數據進行訓練,即「思想數據」。
至於「思想數據」的來源,研究者選取了YouTube視頻和文字錄音,有大約數百萬小時,包含了人們行動、計劃、決定和重新規劃背後的思想。
論文中,研究人員提出了一個新穎的模仿學習框架「思想克隆」。其中,智能體不僅學習人類的示範行為,如行為克隆,而且學習人類行動同時的思考方式。
在思想克隆訓練框架中,智能體學習在每個時間步中產生思想,並隨後根據這些思想調整行動。
在每個時間步中,智能體接收一個觀察、一個任務和一段思維歷史作為輸入。上層組件負責思想生成,下層組件產生以這些思想為條件執行操作。
然後,將生成的想法和行動與演示數據集中的基本事實進行比較,以計算損失。
雖然對於上層和下層組件的條件可能有不同的選擇,但在這項工作中,對於思維數據集中長度t的特定軌跡,研究人員將其最小化:
而下層組件可以從頭開始訓練,或者從目標域中現有的語言條件控制器中改編。
論文中,研究人員基於BabyAI 1.1模型體系結構的兩個組件進行了研究。
該模型利用內存增強架構LSTM來解決部分可觀測性的挑戰。此外,它還採用FiLM進行模態融合,有效地結合了視覺和文本輸入。
這裡,作者特別強調,本文中的所有模型都是從頭開始訓練的,但在復雜領域中還是使用預訓練模型更強。
如下圖,是BabyAI環境示例,左圖中包含了各種顏色的物品(球、鑰匙、盒子、門)。
智能體可以看到它前面的7×7的網格單元,這些網格單元是被牆壁和關閉的門阻擋。
「思想克隆」智能體的任務是,到達紫色的盒子(高亮顯示) ,並開始規劃了路線。
這一過程,就特別像艾娃如何一步一步策劃,讓人類最終相信並幫助自己,逃出囚禁已久的玻璃牢籠。
實驗結果
研究結果表明,「思想克隆」優於行為克隆。
此外,在零樣本和微調設置中,思想克隆在分佈外的任務中比行為克隆優勢更大。
當檢測到危險的想法時,就能終止智能體。測試中,「預犯罪干預」的效果近乎完美,顯示了它在人工智能安全方面的潛力。
「思想克隆」不僅使人工智能更聰明,而且更安全,更容易理解。
因為我們可以觀察到智能體的思想:(1)可以更容易地診斷出事情出錯的原因,(2)通過糾正智能體的思想來引導它,(3)或者阻止它做所計劃的不安全的事情。
作者介紹
傑夫·克盧恩
目前,Jeff Clune是不列顛哥倫比亞大學計算機科學副教授。他主要研究深度學習,包括深度強化學習。
此前,他還是OpenAI研究團隊負責人,Uber人工智能實驗室的高級研究經理和創始成員。
目前是不列顛哥倫比亞大學的博士生,對深度學習,人工智能生成算法感興趣。