AIGC，內容生成巨浪已來

2023-06-20 03:32:16

原文：復旦商業知識

圖片來源：由無界AI‌ 生成

人類文明可以被認為是全人類生活印記的記錄總和。那麼，如果有一個超級大腦學習了人類記錄下的全部知識，是否可以幫助我們創作出更燦爛豐富的文明？

2022年12月，入選《科學》雜誌年度科學十大突破的AIGC，將這一夢想照進了現實。 AIGC全稱為AI-Generated Content，即生成式AI，利用人工智能技術來自動生產內容。對AIGC來說，2022年被認為是其發展速度驚人的一年。 **AIGC可以說是當今AI領域最火爆和充滿幻想的發展方向，AIGC的發展催生了寫作助手、AI繪畫、對話機器人、數字人、辦公室軟件助理等爆款級應用，並通過人機交互形成了新的記錄、學習和再創作範式。 **一個引人注目的問題隨之浮現：AIGC會如何助推新的人工智能浪潮？

記錄、學習和再創作

英雄未必起於微末，OpenAI的故事起於一群對人工智能的未來充滿恐懼的創業新貴。 GPT系列就像OpenAI精心準備的各種飼料所培育出的超級大腦。

成立近三年半後才打造出的GPT-2模型是OpenAI第一個真正意義上的代表作。 GPT-2包含15億參數，以800萬篇Reddit論壇帖子、總計40GB文本為食，顯現出文本續寫的能力。比如輸入《指環王》中的句子，它會生成讓人無法分辨真假、劇情和原著不同，但看上去符合邏輯的續文。

OpenAI瘋狂地想知道要是能吃下更多的語料，這個超級大腦會擁有何種能力，於是擁有1750億參數的GPT-3橫空出世。 GPT-3光訓練就消耗數千萬美元，專家們把此前12年從6000萬個域名中收集的新聞報導、帖子、書籍全文以及各種網頁等數千億個單詞的英文資料統統餵進模型。這次GPT-3不光具備了更強大的語言生成能力，還額外掌握了出色的上下文學習能力和大量的世界知識，寫詩歌、寫新聞報導、回答問題、編寫代碼樣樣精通。而最新的GPT-4的數據處理、理解能力更強，它可以接收並生成25000字的文本，是之前ChatGPT的8倍。

另外，它的邏輯思考能力、圖像理解能力也有了非常大的飛躍。 OpenAI可能是人工智能記錄、學習和再創作這一範式最堅定的踐行者。根據愛丁堡大學與艾倫人工智能研究院推測，從GPT-3到GPT-3.5再到GPT-4，OpenAI內部就已經迭代了多個版本。 **ChatGPT基於人類反饋的強化學習進行指令微調，通過大幅下調上下文學習能力而提升了翔實的回應、公正的回應、拒絕不當問題、拒絕其知識範圍之外的問題四種能力。 **

一路走來的AIGC

除了以ChatGPT為代表的語言生成技術之外，AIGC還包含了圖像生成、視頻生成、音頻生成等。 AIGC漫長的發展歷程，根據中國信通院發布的《AIGC白皮書》，可大致分為以下三個階段：

**早期萌芽階段（20世紀50—90年代）：**受限於科技水平，AIGC僅限於小範圍實驗，生成的內容真實感不強。 1957年，萊杰倫·希勒(Lejaren Hiller) 和倫納德·艾薩克森（Leonard Isaacson）通過將計算機程序中的控制變量改為音符，完成了歷史上第一部由計算機創作的音樂作品——弦樂四重奏《依利亞克組曲》。 1966年，約瑟夫·韋岑鮑姆(Joseph Weizenbaum)和肯尼斯·科爾比(Kenneth Colby) 共同開發了世界上第一個機器人“伊莉莎”(Eliza)，其通過關鍵字掃描和重組來完成交互式任務。 80年代中期，IBM基於隱馬爾可夫鏈模型創造了語音控制打字機“坦戈拉”（Tangora），能夠處理兩萬個單詞。在這一階段，AIGC僅通過學習專家編寫規則進行生成，泛化能力極其有限，就像專家手中擺弄的提線木偶。

**沉積積累階段（20世紀90年代—21世紀10年代）：**AIGC從實驗性向實用性逐漸轉變。深度學習算法、圖形處理單元(GPU)、張量處理器(TPU) 和訓練數據規模等都取得了較大突破。 2007年，紐約大學人工智能研究員羅斯·古德溫（Ross Goodwin）裝配的人工智能係統通過對公路旅行中的所見所聞進行記錄和感知，撰寫出世界上第一部完全由人工智能創作的小說——1 The Road。 2012年，微軟公開展示了一個全自動同聲傳譯系統，通過深度神經網絡（DNN）可以自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成中文語音。在這一階段，AIGC開始自動學習人類記錄的少量數據，掌握了一定泛化能力，但受到算法瓶頸的限制，生成效果有待提升。此時的AIGC就像一隻善於模仿的鸚鵡，看似像模像樣實則一竅不通。

**快速發展階段（21世紀10年代至今）：**自2014年起, 隨著生成式深度學習算法的提出和訓練數據規模的飛速擴充, AIGC生成內容的效果逐漸逼真直至人類難以分辨。 2017年, 微軟人工智能少女“小冰”推出了世界首部完全由人工智能創作的詩集《陽光失了玻璃窗》。 2018年, 英偉達發布的StyleGAN模型可以自動生成圖片, 其生成的高分辨率圖片人眼難以分辨真假。 2021年, OpenAI推出了DALL-E並於一年後推出了升級版本DALL-E-2, 用戶只需輸入簡短的描述性文字, DALL-E-2即可創作出相應極高質量的卡通、寫實、抽像等風格的繪畫作品。 2022年7月，開源AI繪畫工具Stable Diffusion發布，使普通人也能創作專業畫師級別的作品。同年8月，一幅名為《太空歌劇院》的美術作品在美國科羅拉多州博覽會上獲得一等獎，這幅作品正是出自AI之手。隨後發布的Make-A-Video、Imagen Video和Phenaki等模型更是能以文字描述生成視頻。 **2022年11月30日，OpenAI發布對話機器人ChatGPT，至此AIGC時代全面開啟,生成內容百花齊放。 **

數據燃料

歷經近七十年的技術沉澱，AIGC已成為人工智能產業落地的重要形式。 2022年谷歌的研究者發表了題為《大型語言模型的湧現能力》的論文，發現**當語言模型大到超過特定的臨界值，就會湧現出較小的模型不具備的能力。 **近年來，以GPT-4、ChatGPT為代表的大模型技術所取得的顯著成果表明，增大模型規模和數據規模是突破現有技術瓶頸行之有效的方法。

人工智能模型規模越來越大，本質上是為了容納更多的數據，然而人類記錄的高質量數據可能在不久的將來耗盡。人工智能研究和預測組織Epoch在一篇未經同行評審的論文中預測，高質量文本數據、低質量文本數據、圖片數據分別會在2023—2027年、2030—2050年以及2030—2070年被人工智能耗盡。

屆時，基於AIGC的數據合成將成為人工智能新的燃料。目前由人工智能生成的數據佔所有數據的1%不到,**根據諮詢公司高德納（Gartner）預測,到2025年,人工智能生成數據將佔所有數據的10%。 **因此，儘早建立完整的AIGC產業生態，讓用戶主動與AIGC交互生成數據，從而形成數據飛輪，將持續推動人工智能技術的進步。

放眼未來，**人工智能驅動的科學研究（AIGC for science）可能會成為人工智能技術落地的深水區與新的主戰場，即“人工智能開啟未來的科研”。 **過去互聯網公司的數據紅利已經耗盡，但在科學領域積累了海量的實驗數據。在投餵了2.8億種氨基酸序列後，加州伯克利的一家初創公司讓模型學會了蛋白質的語言，首次實現從零合成全新蛋白。 AIGC帶給科學領域的創新方興未艾。 **據預測, 到2025年, 超過30%的藥物和材料將藉助AIGC被發現。 **

人類未來將與AIGC鏈接形成內容創作與知識發現的共生體，但所有人類深層次的東西都不會被AI改變。 OpenAI首席執行官山姆·阿爾特曼（Sam Altman）曾這樣展望：**作為人類，我們依然注重人與人之間的互動聯繫，人類大腦的獎勵機制沒有變，我們依然追求快樂，擁有創造慾和競爭欲，渴望組建家庭……五萬年前人類在意的東西，一百年後的人類也會在意。 **

山姆·阿爾特曼還表示，ChatGPT的火爆讓大家覺得AGI（通用人工智能）似乎離我們近了一些，但實際上類似於ChatGPT這種大語言模型仍距離AGI十分遙遠，未來我們還有很長的路要走。在變與不變之間，AIGC掀起的浪潮已然來臨。

查看原文

本頁面內容僅供參考，非招攬或要約，也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。

讚賞
點讚
留言
分享

留言

0/400

暫無留言

話題
#PI#
294k 帖子
#BTC#
263k 帖子
#ETH#
172k 帖子
4#GateioInto11#
83k 帖子
5#ContentStar#
69k 帖子
6#GT#
69k 帖子
7#DOGE#
63k 帖子
8#BOME#
62k 帖子
9#MAGA#
53k 帖子
10#SLERF#
51k 帖子