Midjourney遇勁敵!谷歌AI繪畫4大牛創業,免費試玩Imagen技術,拿下1.2億天使融資

原文來源:量子位

圖片來源:由無界AI‌ 生成

AI繪畫王座上的MidJourney,終於迎來強勁對手。

最新挑戰者Ideogram橫空出世,開局就靠免費註冊吸引眾多目光。

最矚目的特性:在圖中精準生成文字,英偉達科學家範麟熙直接毫不客氣地用它畫了一個**“It's over, Midjourney”**。

背後公司Ideogram AI,谷歌AI繪畫4大牛集體離職的創業項目,坐標多倫多,帶著1650萬美元 (約1.2億人民幣)種子輪融資席捲而來。

創始團隊中前4人都是谷歌文生圖研究Imagen論文作者,組成一個擴散模型頂級研究團隊。

谷歌藏著掖著這麼久都不給大家玩的先進研究成果,終於被他們給開放出來。

Ideogram AI種子輪融資由a16zIndex Ventures領投。

個人投資者中也不乏知名人物,如OpenAI創始成員Andrej Karpathy,強化學習大牛Pieter Abbeel,Node.js創始人Ryan Dahl、GitHub聯合創始人Tom Preston-Werner等。

甚至團隊的老上司,前谷歌大腦掌門人Jeff Dean也有參與。

別看創始團隊都是技術出身,Ideogram AI在宣傳造勢方面也一點不含糊,直接在𝕏上號召大家刷二創tag,開啟了一波病毒營銷。

AI學會精準畫出文字

讓AI精準畫出文字,一直是個難題。雖然SDXL和Midjourney新出的局部重繪功能有所改善,但網友反饋成功率一直不太高,需要反复嘗試。

Ideogram一搞定這個痛點,直接被網友們玩出花了。

讓文字出現在指示牌上、同時適應環境光影,沒問題。

做一個咖啡拉花也沒問題。

抽像風格的海報,也可以搞出風格合適的字體。

一句話直出品牌logo更是生產力屬性拉滿。

從網友們分享的提示詞中也可以看出,增加畫文字成功概率的“咒語”也很簡單,就一個單詞:

typography(印刷排版)

不過很可惜的是,它還不太能掌握中文。

拋開文字,Ideogram的圖像生成能力,出圖質量可以比肩MidJourney和Stable Diffusion。

如果與Imagen使用完全相同的技術,那麼使用谷歌T5而不是OpenAI CLIP作為語言編碼模型,意味著Ideogram對提示詞裡空間關係描述的理解還要更強。

有人成功用它生成一組風格一致的圖像。

再結合視頻生成工具Pika Labs直接搞出電影預告片風格的短片。

擴散模型頂級研究團隊

Ideogram AI創始團隊共7人,其中4人都是谷歌Imagen的合著者。

其中共同一作Mohammad Norouzi任CEO,他在多倫多大學計算機科學博士就讀期間拿到了谷歌ML博士獎學金。

畢業後他加入谷歌大腦工作了7年,除了生成模型之外也是也是谷歌神經機器翻譯團隊的原始成員,Hinton團隊自監督對比學習框架SimCLR的合著者。

共同一作William Chan (陳俊樂)任新公司CTO,他先后就读于加拿大滑铁卢大学、卡内基梅隆大学。

他2012年加入谷歌時先做的機器學習廣告工程,後轉到谷歌大腦作NLP研究。

第三位共同一作Chitwan Saharia本科畢業於孟買理工學院,2019年加入谷歌,現在是Ideogram的聯合創始人。

第四位聯創Jonathan Ho博士畢業於UC伯克利,曾在OpenAI工作一年,後加入谷歌。

他除了是Imagen論文的核心貢獻者,還是去噪擴散模型奠基之作**《Denoising Diffusion Probabilistic Models》**的一作,這篇論文合著者中的Pieter Abbeel也是Ideogram AI的投資人。

創始團隊中的另外三人,Shayaan Abdullah曾是Twitter的機器學習工程師,於今年4月離職,後加入Ideogram AI。

Jacob Lu為軟件工程師,加入Ideogram之前曾在亞馬遜等公司任職;Jenny Lei是軟件工程實習生,加入Ideogram AI之前曾在谷歌實習。

還要做視頻生成

Ideogram AI的四位聯創在谷歌期間,還完成了視頻生成的後續工作Imagen Video

在一年前就已經實現了生成1280*768分辨率、每秒24幀的高清視頻片段。

實際上在今年3月,量子位就曾從投資市場獲悉他們的天使輪估值達到1億美元,更多VC想給錢而趕不上、投不進,以及他們創業方向的更多消息:

**不僅做圖像生成,將來還要做視頻生成。 **

無論Imagen還是Imagen Video,谷歌出於安全、倫理等方面考慮都未曾放出試玩、API或開源代碼。

研究成果無法轉化為應用,是近年來不少從谷歌離職創業者遇到的共同問題。

如大模型那邊的Transformer八位作者中,Cohere創始人Aidan Gomez就曾表示離開的原因是**“我在谷歌沒有看到大模型發揮它真正的力量”**。

Ashish Vaswani與Niki Parmar離開谷歌創辦Adept AI與Essential AI的原因也是**“谷歌希望用Transformer優化現有產品,而我們希望創造新產品”**。

後來這些研究者所擔心的事也確確實實發生了:

儘管2021年5月(比ChatGPT訓練數據截止日期還早)谷歌就已經開發出了LaMDA對話大模型與聊天機器人,但在推出產品方面有太多顧慮,最終** 18個月後被隔壁ChatGPT**一手直接面對公眾開放搶盡了風頭。

……

吸取了這些教訓,新成立的Ideogram AI也拿出一副盡量開放、先把用戶吸引進來玩的架勢。

最初宣布了1000人測試名額,但沒一會就滿了。

今天似乎又開放了一些名額,量子位上午註冊時並沒有遇到排隊。

總之名額應該還是有限的,感興趣的朋友抓緊了。

試玩地址:

參考鏈接: [1] /發射 [2] [3] [4]

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)