10秒分析2萬字論文,這款大模型能幫我寫畢業論文嗎| AI實測

原文來源:頭號AI 玩家

圖片來源:由無界AI 生成

7月26日,網易有道正式發布“子曰”大模型,並上線了基於“子曰”大模型的六大應用成果——“LLM翻譯”、“AIBox”、“語法精講”、“文檔問答”、“虛擬人口語教練”、“AI作文指導”。

作為首個教育領域的垂類大模型,“子曰”的表現究竟如何?能滿足我們對教育垂類大模型的期待嗎?

“頭號AI玩家”在圍觀了網易有道“子曰”大模型發布會後,對“子曰”大模型搭載的六個應用功能進行了一番評測,希望給各位玩家一些參考。

翻譯生產力工具——“LLM翻譯”

網易有道無疑在國內翻譯領域領先多年。

據官方數據,有道翻譯的月活用戶數超1億,是國內排名第一的詞典和翻譯類的產品。隨著用戶對於翻譯質量的要求越來越高,從“能看懂就行”逐漸變成“精準表達”,搭載LLM(大語言模型)的有道翻譯,翻譯的質量如何?能夠滿足用戶的需求嗎?

我們摘取了外國新聞網站上關於新電影《奧本海默》的報導片段,分別對“LLM翻譯”以及人工智能機器人Claude ai進行對比測試。

可以看到,由於中英文在表達習慣、文化背景以及語法的截然不同,Claude ai對中文語句的表述仍然存在一些短板。

比如對於“核武器”的動詞搭配使用,Claude ai採用了“開發”,而“LLM翻譯”則使用了中文習慣搭配的“研發”。

但在後續對於《奧本海默》的翻譯理解,兩者都沒有將其準確翻譯為“奧本海默的上映……正值新技術大量湧現”。

Claude ai在表述上不符合中文的表達習慣,而“LLM翻譯”忽略了“上映”這個詞,可能是由於缺少具體的篇章背景,導致翻譯不夠準確。

我們同樣將這段英文上傳給了谷歌翻譯,它給出的答案顯然更繞口了:

嘗試過英譯中之後,我們決定再測試一下兩者對於古詩詞的翻譯理解。

“請將'飛流直下三千尺,疑是銀河落九天'翻譯成英文。”

結果有點出乎意料,將中文翻譯成英文時,Claude ai能夠以對仗形式同步翻譯成英文。

反觀“LLM翻譯”以詩人為第一視角,翻譯成英文時補充了缺失的主語對象,但將“瀑布”翻譯成“swift current”(水流速度較快的溪流),沒有“waterfall”來得準確。

總的來說,有道LLM翻譯在英譯中的領域,可以根據語境提供更地道的翻譯,有些表述優於Claude ai。和傳統的機器翻譯相比,理解準確度、表達通順度以及語義流暢性,都有明顯提升。而在中譯英環節,LLM翻譯對單個詞彙的選擇,不如Claude ai表現得那麼精準。

網易有道CEO周楓在發布會上表示,這款“LLM翻譯基於有道多年積累的神經網絡翻譯數據,使用了大量的新技術,包括此前未曾採用的單語言語料,在理解上下文、常識推理方面的能力,能給大家更好的翻譯體驗”。

語句潤色助手——AI box

除了接入大語言模型,有道翻譯同樣推出了語句潤色助手——AI box。

值得一提的是,網易有道翻譯客戶端已經全面上線了AI box功能。我們拿出了曾經的英文作文,邀請AI box進行一下潤色改寫,看看效果如何。

這篇文章主要是寫一封邀請函邀請大學教授來中國進行考察,我們選擇了“句子潤色-專業化”的功能。

可以看到,AI box能夠直接將文檔裡的英文語句以想要的方式進行改寫,並提出改寫意見。

根據所寫文章的風格不同,用戶也可以選擇“更華麗、更友好、更簡潔”等等,AI box同時會進行相應的語法糾錯:

下方顯眼的“讓詞彙更符合SCI論文寫作”妥妥的科研黨福音

參考文獻不再是難事——文檔問答

在學術研究中,閱讀文獻是最常見也最耗時的環節。

眾所周知,ChatGPT沒有辦法讀長論文,而更新後的Claude 2在文本分析、長文檔處理方面儘管有所加強,但花費時間較久。

網易有道首席科學家段亦濤表示:“有道的文檔問答功能能夠讓用戶工作效率提高十倍。”

我們嘗試上傳了一篇近2萬字的新聞學領域論文,大概10秒後,“子曰”大模型便將它全文翻譯了一遍,並且針對不同的頁面進行了總結性發言。

在文檔問答頁面,原文和譯文會分別展示,我們可以針對論文細節,進行標註和截圖提問,有道速讀都可以快速給出回答。

如果你不想讀完整篇論文,可以直接讓大模型總結論文的最終結論:

同樣也可以讓它解釋一下論文中的新概念,幫助我們更好理解論文的相關內容:

和Claude ai相比,“文檔問答”更方便的功能是直接截圖詢問。

比如,我截取了論文中的圖表,讓大模型解釋一下是什麼意思。它在給出答案的同時,也標註了信息來源,方便用戶進行事實核查。

“文檔問答”能夠幫助用戶快速判斷一篇文章值不值得精讀,但只能夠針對單篇文檔進行解讀分析,還不具備聯網查閱同類資料的功能。

如果要了解同行相關研究,大模型目前還無法解答。

24小時在線外教——口語教練

除了上述的幾項應用功能外,“子曰”大模型還將重點放在了英語學習中需求較大的領域——口語陪練。

目前,在網易有道的內測網頁可以體驗AI口語教練功能。

我們可以和口語教練談論任何感興趣的話題,每個話題頁面下都有相關的學習目標和挑戰,以鼓勵用戶在對話中積極表達。

首先我們選擇了“最喜歡的電視節目”開啟今天的話題,談到最新上映的好萊塢電影,以及演員罷工的事件,“口語教練”給出瞭如下回答。

如果我的發音不標準,口語教練還能夠識別出來嗎?

比如我在念《奧本海默》時,“語音轉文字”環節將我的語句識別為了“open”,但口語教練卻依舊能夠“聽懂”我,並且評價這是一部不錯的電影,看來Chinglish也並不能難倒他。

練習口語時,“口語教練”能夠在相應的語言環境中扮演不同的角色,一步步引導用戶主動“開口說英語”。

和同類產品相比,“口語教練”有什麼優勢?此前,科技公司Animato發布了一款真人對話人工智能“Call Annie”。這位叫Annie的30歲女性,能夠承擔一對一的外教工作,幫助用戶訓練口語和聽力,Annie一度也成為了互聯網AI名師。

我們嘗試發現,Annie的語速和VOA(美國之聲)差不多,並且是個“話嘮”。

如果開啟了一個話題,你就很難打斷她,只能靜靜聽她分享完,一時分不清究竟是誰在訓練英語。

此外,她對中文的識別並不熟練,視頻過程中如果發音不准,或是出現了中英文夾雜的情況,Annie就無法成功識別。比如她就沒聽懂我分享的電影名稱。

從互動性、話題討論度以及用詞精準度來說,“口語教練”適配了不同英語水平的用戶,做到了啟發式學習陪伴,並且從發音、語法、用詞等維度給予用戶潤色建議,是個更適合中國寶寶的英語陪練。這些是“Call Annie”這個App目前還不具備的功能。

有道研發團隊表示:“通用的對話機器人是無法滿足口語練習的要求的。Call Annie的產品定位並非是外語學習,更像是一個虛擬助手。我們優化了口語教練模型的啟發性,我們期望這個模型能夠更好地引導用戶說英語。”

基於口語教練的功能,此前在2023世界人工智能大會上,網易有道便帶來了升級版的口語教練——虛擬人口語陪練Echo,結合了有道自研的“子曰”大模型,還有網易伏羲大模型提供的虛擬人生成技術。

對於虛擬口語教練,有道研發團隊在發布會坦言,“口語陪練畢竟是一個百億的市場,期待這位口語教練,能慢慢取代真人陪練。”

未來,用戶可以體驗到類似真人的1V1口語私教體驗,虛擬教練不僅有豐富的表情、地道的口音,還能對練習者的發音給出私人建議。

AI作文指導

針對語言學習,網易有道還推出了“AI作文指導”功能,解決學生在日常寫作中面臨的素材匱乏、主旨不明確等問題。

進入到中文寫作界面,可以看到該功能包括了兩個方面“教我寫作文”和“幫我改作文”。在“教我寫作文”板塊,只需要錄入作文的題目就能獲得智能解析,幫助學生對作文主題有較清晰的認識,以便更好地下筆。

我們從高考作文中選擇了一道作文題,讓“中文寫作”功能試著寫一寫。

相比ChatGPT等其他語言模型會直接生成一篇文章,“中文寫作”則是指導學生如何下筆,引導他們自行探索答案。它會從核心觀點、素材參考以及段落分配等方面指導學生作文框架。

“想要創作一篇好的文章,最難的是什麼?網易有道智能硬件產品經理高慧湍在發布會上指出,“找到創作的思路才是寫作中最難的部分。 ”

他強調,“AI作文指導功能提供的更多是寫作中的創作方法和思路,而不是簡單的素材和範文。”

“幫我改”的功能可以深入理解作文的內容,從表達、結構、情感、素材豐富度四個維度進行作文改寫。

我們將Claude ai生成的文章上傳到了“AI作文”,AI寫的文章在AI手下得到的評級是“優秀”。可能是文章真的無可挑剔,“AI作文”批改的重點便放在了好詞好句以及文章寫作結構上。

最終,這段包含錯別字修改、改進建議、好詞好句、作文總評等內容的作文批改,會被綜合成一份完整的報告。用戶就能根據這份報告,有針對性地提高薄弱環節。

以上幾項應用,都是在不同的教學場景下,人和AI技術完成的一次教與學的互動。

在發布會上,網易有道CEO周楓也一直在強調“場景”的重要性,他指出:“一個好的技術有沒有價值、能不能發揮巨大的作用,很多時候關鍵在場景和應用的選擇,以及細節的打磨。”

當科技巨頭紛紛將精力投入大模型研發,各類企業參與著大模型在教育場景的落地。

今年5月,科大訊飛發布了全球首款搭載大模型的AI學習機,提供作文批改、模擬口語老師對話等功能。

5月8日,學而思宣布計劃研發數學大模型,主要面向全球的數學愛好者,以數學解題和講題算法為核心。

步步高同樣更新上線了步步高學習機,推出AI生成個性化知識圖譜、AI智能推薦相似題等功能。

在ChatGPT爆紅之後,周楓接受采訪時就表示,有道是國內自然語言處理能力領先的公司。其實繼五月網易有道發布一段基於“子曰”大模型研發的AI口語老師劇透視頻後,7月這款類ChatGPT模型“子曰”才正式上線,顯得有些“姍姍來遲”。

“比起其他AI工具的聊天對話能力,網易有道大模型更注重的是教育應用的落地”,周楓在發布會上強調,“子曰大模型不僅可以幫助學生更好地學習,也可以幫助教師更好地教學,一對一的教學更多地變成現實”。

教育、文本潤色改寫、口語陪練,網易有道“子曰”大模型將這些AI熱點幾乎覆蓋了一遍,而在相關測評頁面我們也能發現,棋類教育、編程教育等教育垂類的功能也在開發中。

“子曰”大模型在未來能否成為教育行業的“全能老師”,有待時間驗證。

查看原文
本頁面內容僅供參考,非招攬或要約,也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)