🔥 Gate 動態大使專屬發帖福利任務第三期報名正式開啓!🏆 第二期獲獎名單將於6月3日公布!
👉️ 6月3日 — 6月8日期間每日發帖,根據帖子內容評級瓜分 $300獎池
報名即可參與:https://www.gate.com/zh/questionnaire/6761
報名時間:6月3日10:00 - 6月8日 24:00 UTC+8
🎁 獎勵詳情:
一、S級周度排名獎
S級:每週7日均完成發帖且整體帖子內容質量分數>90分可獲S級,挑選2名優質內容大使每人$50手續費返現券。
二、A/B 等級瓜分獎
根據各位動態大使發帖數量及帖子內容質量獲評等級,按評定等級獲獎:
A級:每週至少5日完成發帖且整體帖子內容質量90>分數>80可獲A級,從A級用戶中選出5名大使每人$20手續費返現券
B級:每週至少3日完成發帖且整體帖子內容質量80>分數>60可獲B級,從B級用戶中選出10名大使每人$10手續費返現券
📍 活動規則:
1.每週至少3日完成發帖才有機會獲獎。
2.根據發帖天數和整體發帖內容質量分數給予等級判定,分爲S/A/B等級,在各等級下選擇幸運大使獲獎。
💡 帖子評分標準:
1.每帖不少於30字。
2.內容需原創、有獨立見解,具備深度和邏輯性。
3.鼓勵發布市場行情、交易知識、幣種研究等主題,使用圖例或視頻可提高評分。
4.禁止發布FUD、抄襲或詆毀內容,違規將取
AIGC,內容生成巨浪已來
原文:復旦商業知識
人類文明可以被認為是全人類生活印記的記錄總和。那麼,如果有一個超級大腦學習了人類記錄下的全部知識,是否可以幫助我們創作出更燦爛豐富的文明?
2022年12月,入選《科學》雜誌年度科學十大突破的AIGC,將這一夢想照進了現實。 AIGC全稱為AI-Generated Content,即生成式AI,利用人工智能技術來自動生產內容。對AIGC來說,2022年被認為是其發展速度驚人的一年。 **AIGC可以說是當今AI領域最火爆和充滿幻想的發展方向,AIGC的發展催生了寫作助手、AI繪畫、對話機器人、數字人、辦公室軟件助理等爆款級應用,並通過人機交互形成了新的記錄、學習和再創作範式。 **一個引人注目的問題隨之浮現:AIGC會如何助推新的人工智能浪潮?
記錄、學習和再創作
英雄未必起於微末,OpenAI的故事起於一群對人工智能的未來充滿恐懼的創業新貴。 GPT系列就像OpenAI精心準備的各種飼料所培育出的超級大腦。
成立近三年半後才打造出的GPT-2模型是OpenAI第一個真正意義上的代表作。 GPT-2包含15億參數,以800萬篇Reddit論壇帖子、總計40GB文本為食,顯現出文本續寫的能力。比如輸入《指環王》中的句子,它會生成讓人無法分辨真假、劇情和原著不同,但看上去符合邏輯的續文。
OpenAI瘋狂地想知道要是能吃下更多的語料,這個超級大腦會擁有何種能力,於是擁有1750億參數的GPT-3橫空出世。 GPT-3光訓練就消耗數千萬美元,專家們把此前12年從6000萬個域名中收集的新聞報導、帖子、書籍全文以及各種網頁等數千億個單詞的英文資料統統餵進模型。這次GPT-3不光具備了更強大的語言生成能力,還額外掌握了出色的上下文學習能力和大量的世界知識,寫詩歌、寫新聞報導、回答問題、編寫代碼樣樣精通。而最新的GPT-4的數據處理、理解能力更強,它可以接收並生成25000字的文本,是之前ChatGPT的8倍。
另外,它的邏輯思考能力、圖像理解能力也有了非常大的飛躍。 OpenAI可能是人工智能記錄、學習和再創作這一範式最堅定的踐行者。根據愛丁堡大學與艾倫人工智能研究院推測,從GPT-3到GPT-3.5再到GPT-4,OpenAI內部就已經迭代了多個版本。 **ChatGPT基於人類反饋的強化學習進行指令微調,通過大幅下調上下文學習能力而提升了翔實的回應、公正的回應、拒絕不當問題、拒絕其知識範圍之外的問題四種能力。 **
一路走來的AIGC
除了以ChatGPT為代表的語言生成技術之外,AIGC還包含了圖像生成、視頻生成、音頻生成等。 AIGC漫長的發展歷程,根據中國信通院發布的《AIGC白皮書》,可大致分為以下三個階段:
**早期萌芽階段(20世紀50—90年代):**受限於科技水平,AIGC僅限於小範圍實驗,生成的內容真實感不強。 1957年,萊杰倫·希勒(Lejaren Hiller) 和倫納德·艾薩克森(Leonard Isaacson)通過將計算機程序中的控制變量改為音符,完成了歷史上第一部由計算機創作的音樂作品——弦樂四重奏《依利亞克組曲》。 1966年,約瑟夫·韋岑鮑姆(Joseph Weizenbaum)和肯尼斯·科爾比(Kenneth Colby) 共同開發了世界上第一個機器人“伊莉莎”(Eliza),其通過關鍵字掃描和重組來完成交互式任務。 80年代中期,IBM基於隱馬爾可夫鏈模型創造了語音控制打字機“坦戈拉”(Tangora),能夠處理兩萬個單詞。在這一階段,AIGC僅通過學習專家編寫規則進行生成,泛化能力極其有限,就像專家手中擺弄的提線木偶。
**沉積積累階段(20世紀90年代—21世紀10年代):**AIGC從實驗性向實用性逐漸轉變。深度學習算法、圖形處理單元(GPU)、張量處理器(TPU) 和訓練數據規模等都取得了較大突破。 2007年,紐約大學人工智能研究員羅斯·古德溫(Ross Goodwin)裝配的人工智能係統通過對公路旅行中的所見所聞進行記錄和感知,撰寫出世界上第一部完全由人工智能創作的小說——1 The Road。 2012年,微軟公開展示了一個全自動同聲傳譯系統,通過深度神經網絡(DNN)可以自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成中文語音。在這一階段,AIGC開始自動學習人類記錄的少量數據,掌握了一定泛化能力,但受到算法瓶頸的限制,生成效果有待提升。此時的AIGC就像一隻善於模仿的鸚鵡,看似像模像樣實則一竅不通。
**快速發展階段(21世紀10年代至今):**自2014年起, 隨著生成式深度學習算法的提出和訓練數據規模的飛速擴充, AIGC生成內容的效果逐漸逼真直至人類難以分辨。 2017年, 微軟人工智能少女“小冰”推出了世界首部完全由人工智能創作的詩集《陽光失了玻璃窗》。 2018年, 英偉達發布的StyleGAN模型可以自動生成圖片, 其生成的高分辨率圖片人眼難以分辨真假。 2021年, OpenAI推出了DALL-E並於一年後推出了升級版本DALL-E-2, 用戶只需輸入簡短的描述性文字, DALL-E-2即可創作出相應極高質量的卡通、寫實、抽像等風格的繪畫作品。 2022年7月,開源AI繪畫工具Stable Diffusion發布,使普通人也能創作專業畫師級別的作品。同年8月,一幅名為《太空歌劇院》的美術作品在美國科羅拉多州博覽會上獲得一等獎,這幅作品正是出自AI之手。隨後發布的Make-A-Video、Imagen Video和Phenaki等模型更是能以文字描述生成視頻。 **2022年11月30日,OpenAI發布對話機器人ChatGPT,至此AIGC時代全面開啟,生成內容百花齊放。 **
數據燃料
歷經近七十年的技術沉澱,AIGC已成為人工智能產業落地的重要形式。 2022年谷歌的研究者發表了題為《大型語言模型的湧現能力》的論文,發現**當語言模型大到超過特定的臨界值,就會湧現出較小的模型不具備的能力。 **近年來,以GPT-4、ChatGPT為代表的大模型技術所取得的顯著成果表明,增大模型規模和數據規模是突破現有技術瓶頸行之有效的方法。
人工智能模型規模越來越大,本質上是為了容納更多的數據,然而人類記錄的高質量數據可能在不久的將來耗盡。人工智能研究和預測組織Epoch在一篇未經同行評審的論文中預測,高質量文本數據、低質量文本數據、圖片數據分別會在2023—2027年、2030—2050年以及2030—2070年被人工智能耗盡。
屆時,基於AIGC的數據合成將成為人工智能新的燃料。目前由人工智能生成的數據佔所有數據的1%不到,**根據諮詢公司高德納(Gartner)預測,到2025年,人工智能生成數據將佔所有數據的10%。 **因此,儘早建立完整的AIGC產業生態,讓用戶主動與AIGC交互生成數據,從而形成數據飛輪,將持續推動人工智能技術的進步。
放眼未來,**人工智能驅動的科學研究(AIGC for science)可能會成為人工智能技術落地的深水區與新的主戰場,即“人工智能開啟未來的科研”。 **過去互聯網公司的數據紅利已經耗盡,但在科學領域積累了海量的實驗數據。在投餵了2.8億種氨基酸序列後,加州伯克利的一家初創公司讓模型學會了蛋白質的語言,首次實現從零合成全新蛋白。 AIGC帶給科學領域的創新方興未艾。 **據預測, 到2025年, 超過30%的藥物和材料將藉助AIGC被發現。 **
人類未來將與AIGC鏈接形成內容創作與知識發現的共生體,但所有人類深層次的東西都不會被AI改變。 OpenAI首席執行官山姆·阿爾特曼(Sam Altman)曾這樣展望:**作為人類,我們依然注重人與人之間的互動聯繫,人類大腦的獎勵機制沒有變,我們依然追求快樂,擁有創造慾和競爭欲,渴望組建家庭……五萬年前人類在意的東西,一百年後的人類也會在意。 **
山姆·阿爾特曼還表示,ChatGPT的火爆讓大家覺得AGI(通用人工智能)似乎離我們近了一些,但實際上類似於ChatGPT這種大語言模型仍距離AGI十分遙遠,未來我們還有很長的路要走。在變與不變之間,AIGC掀起的浪潮已然來臨。