10秒分析2萬字論文，這款大模型能幫我寫畢業論文嗎| AI實測

巴比特_

2023-07-28 10:56:20

原文來源：頭號AI 玩家

圖片來源：由無界AI 生成

7月26日，網易有道正式發布“子曰”大模型，並上線了基於“子曰”大模型的六大應用成果——“LLM翻譯”、“AIBox”、“語法精講”、“文檔問答”、“虛擬人口語教練”、“AI作文指導”。

作為首個教育領域的垂類大模型，“子曰”的表現究竟如何？能滿足我們對教育垂類大模型的期待嗎？

“頭號AI玩家”在圍觀了網易有道“子曰”大模型發布會後，對“子曰”大模型搭載的六個應用功能進行了一番評測，希望給各位玩家一些參考。

翻譯生產力工具——“LLM翻譯”

網易有道無疑在國內翻譯領域領先多年。

據官方數據，有道翻譯的月活用戶數超1億，是國內排名第一的詞典和翻譯類的產品。隨著用戶對於翻譯質量的要求越來越高，從“能看懂就行”逐漸變成“精準表達”，搭載LLM（大語言模型）的有道翻譯，翻譯的質量如何？能夠滿足用戶的需求嗎？

我們摘取了外國新聞網站上關於新電影《奧本海默》的報導片段，分別對“LLM翻譯”以及人工智能機器人Claude ai進行對比測試。

可以看到，由於中英文在表達習慣、文化背景以及語法的截然不同，Claude ai對中文語句的表述仍然存在一些短板。

比如對於“核武器”的動詞搭配使用，Claude ai採用了“開發”，而“LLM翻譯”則使用了中文習慣搭配的“研發”。

但在後續對於《奧本海默》的翻譯理解，兩者都沒有將其準確翻譯為“奧本海默的上映……正值新技術大量湧現”。

Claude ai在表述上不符合中文的表達習慣，而“LLM翻譯”忽略了“上映”這個詞，可能是由於缺少具體的篇章背景，導致翻譯不夠準確。

我們同樣將這段英文上傳給了谷歌翻譯，它給出的答案顯然更繞口了：

嘗試過英譯中之後，我們決定再測試一下兩者對於古詩詞的翻譯理解。

“請將'飛流直下三千尺，疑是銀河落九天'翻譯成英文。”

結果有點出乎意料，將中文翻譯成英文時，Claude ai能夠以對仗形式同步翻譯成英文。

反觀“LLM翻譯”以詩人為第一視角，翻譯成英文時補充了缺失的主語對象，但將“瀑布”翻譯成“swift current”（水流速度較快的溪流），沒有“waterfall”來得準確。

總的來說，有道LLM翻譯在英譯中的領域，可以根據語境提供更地道的翻譯，有些表述優於Claude ai。和傳統的機器翻譯相比，理解準確度、表達通順度以及語義流暢性，都有明顯提升。而在中譯英環節，LLM翻譯對單個詞彙的選擇，不如Claude ai表現得那麼精準。

網易有道CEO周楓在發布會上表示，這款“LLM翻譯基於有道多年積累的神經網絡翻譯數據，使用了大量的新技術，包括此前未曾採用的單語言語料，在理解上下文、常識推理方面的能力，能給大家更好的翻譯體驗”。

語句潤色助手——AI box

除了接入大語言模型，有道翻譯同樣推出了語句潤色助手——AI box。

值得一提的是，網易有道翻譯客戶端已經全面上線了AI box功能。我們拿出了曾經的英文作文，邀請AI box進行一下潤色改寫，看看效果如何。

這篇文章主要是寫一封邀請函邀請大學教授來中國進行考察，我們選擇了“句子潤色-專業化”的功能。

可以看到，AI box能夠直接將文檔裡的英文語句以想要的方式進行改寫，並提出改寫意見。

根據所寫文章的風格不同，用戶也可以選擇“更華麗、更友好、更簡潔”等等，AI box同時會進行相應的語法糾錯：

下方顯眼的“讓詞彙更符合SCI論文寫作”妥妥的科研黨福音

參考文獻不再是難事——文檔問答

在學術研究中，閱讀文獻是最常見也最耗時的環節。

眾所周知，ChatGPT沒有辦法讀長論文，而更新後的Claude 2在文本分析、長文檔處理方面儘管有所加強，但花費時間較久。

網易有道首席科學家段亦濤表示：“有道的文檔問答功能能夠讓用戶工作效率提高十倍。”

我們嘗試上傳了一篇近2萬字的新聞學領域論文，大概10秒後，“子曰”大模型便將它全文翻譯了一遍，並且針對不同的頁面進行了總結性發言。

在文檔問答頁面，原文和譯文會分別展示，我們可以針對論文細節，進行標註和截圖提問，有道速讀都可以快速給出回答。

如果你不想讀完整篇論文，可以直接讓大模型總結論文的最終結論：

同樣也可以讓它解釋一下論文中的新概念，幫助我們更好理解論文的相關內容：

和Claude ai相比，“文檔問答”更方便的功能是直接截圖詢問。

比如，我截取了論文中的圖表，讓大模型解釋一下是什麼意思。它在給出答案的同時，也標註了信息來源，方便用戶進行事實核查。

“文檔問答”能夠幫助用戶快速判斷一篇文章值不值得精讀，但只能夠針對單篇文檔進行解讀分析，還不具備聯網查閱同類資料的功能。

如果要了解同行相關研究，大模型目前還無法解答。

24小時在線外教——口語教練

除了上述的幾項應用功能外，“子曰”大模型還將重點放在了英語學習中需求較大的領域——口語陪練。

目前，在網易有道的內測網頁可以體驗AI口語教練功能。

我們可以和口語教練談論任何感興趣的話題，每個話題頁面下都有相關的學習目標和挑戰，以鼓勵用戶在對話中積極表達。

首先我們選擇了“最喜歡的電視節目”開啟今天的話題，談到最新上映的好萊塢電影，以及演員罷工的事件，“口語教練”給出瞭如下回答。

如果我的發音不標準，口語教練還能夠識別出來嗎？

比如我在念《奧本海默》時，“語音轉文字”環節將我的語句識別為了“open”，但口語教練卻依舊能夠“聽懂”我，並且評價這是一部不錯的電影，看來Chinglish也並不能難倒他。

練習口語時，“口語教練”能夠在相應的語言環境中扮演不同的角色，一步步引導用戶主動“開口說英語”。

和同類產品相比，“口語教練”有什麼優勢？此前，科技公司Animato發布了一款真人對話人工智能“Call Annie”。這位叫Annie的30歲女性，能夠承擔一對一的外教工作，幫助用戶訓練口語和聽力，Annie一度也成為了互聯網AI名師。

我們嘗試發現，Annie的語速和VOA（美國之聲）差不多，並且是個“話嘮”。

如果開啟了一個話題，你就很難打斷她，只能靜靜聽她分享完，一時分不清究竟是誰在訓練英語。

此外，她對中文的識別並不熟練，視頻過程中如果發音不准，或是出現了中英文夾雜的情況，Annie就無法成功識別。比如她就沒聽懂我分享的電影名稱。

從互動性、話題討論度以及用詞精準度來說，“口語教練”適配了不同英語水平的用戶，做到了啟發式學習陪伴，並且從發音、語法、用詞等維度給予用戶潤色建議，是個更適合中國寶寶的英語陪練。這些是“Call Annie”這個App目前還不具備的功能。

有道研發團隊表示：“通用的對話機器人是無法滿足口語練習的要求的。Call Annie的產品定位並非是外語學習，更像是一個虛擬助手。我們優化了口語教練模型的啟發性，我們期望這個模型能夠更好地引導用戶說英語。”

基於口語教練的功能，此前在2023世界人工智能大會上，網易有道便帶來了升級版的口語教練——虛擬人口語陪練Echo，結合了有道自研的“子曰”大模型，還有網易伏羲大模型提供的虛擬人生成技術。

對於虛擬口語教練，有道研發團隊在發布會坦言，“口語陪練畢竟是一個百億的市場，期待這位口語教練，能慢慢取代真人陪練。”

未來，用戶可以體驗到類似真人的1V1口語私教體驗，虛擬教練不僅有豐富的表情、地道的口音，還能對練習者的發音給出私人建議。

AI作文指導

針對語言學習，網易有道還推出了“AI作文指導”功能，解決學生在日常寫作中面臨的素材匱乏、主旨不明確等問題。

進入到中文寫作界面，可以看到該功能包括了兩個方面“教我寫作文”和“幫我改作文”。在“教我寫作文”板塊，只需要錄入作文的題目就能獲得智能解析，幫助學生對作文主題有較清晰的認識，以便更好地下筆。

我們從高考作文中選擇了一道作文題，讓“中文寫作”功能試著寫一寫。

相比ChatGPT等其他語言模型會直接生成一篇文章，“中文寫作”則是指導學生如何下筆，引導他們自行探索答案。它會從核心觀點、素材參考以及段落分配等方面指導學生作文框架。

“想要創作一篇好的文章，最難的是什麼？網易有道智能硬件產品經理高慧湍在發布會上指出，“找到創作的思路才是寫作中最難的部分。 ”

他強調，“AI作文指導功能提供的更多是寫作中的創作方法和思路，而不是簡單的素材和範文。”

“幫我改”的功能可以深入理解作文的內容，從表達、結構、情感、素材豐富度四個維度進行作文改寫。

我們將Claude ai生成的文章上傳到了“AI作文”，AI寫的文章在AI手下得到的評級是“優秀”。可能是文章真的無可挑剔，“AI作文”批改的重點便放在了好詞好句以及文章寫作結構上。

最終，這段包含錯別字修改、改進建議、好詞好句、作文總評等內容的作文批改，會被綜合成一份完整的報告。用戶就能根據這份報告，有針對性地提高薄弱環節。

以上幾項應用，都是在不同的教學場景下，人和AI技術完成的一次教與學的互動。

在發布會上，網易有道CEO周楓也一直在強調“場景”的重要性，他指出：“一個好的技術有沒有價值、能不能發揮巨大的作用，很多時候關鍵在場景和應用的選擇，以及細節的打磨。”

當科技巨頭紛紛將精力投入大模型研發，各類企業參與著大模型在教育場景的落地。

今年5月，科大訊飛發布了全球首款搭載大模型的AI學習機，提供作文批改、模擬口語老師對話等功能。

5月8日，學而思宣布計劃研發數學大模型，主要面向全球的數學愛好者，以數學解題和講題算法為核心。

步步高同樣更新上線了步步高學習機，推出AI生成個性化知識圖譜、AI智能推薦相似題等功能。

在ChatGPT爆紅之後，周楓接受采訪時就表示，有道是國內自然語言處理能力領先的公司。其實繼五月網易有道發布一段基於“子曰”大模型研發的AI口語老師劇透視頻後，7月這款類ChatGPT模型“子曰”才正式上線，顯得有些“姍姍來遲”。

“比起其他AI工具的聊天對話能力，網易有道大模型更注重的是教育應用的落地”，周楓在發布會上強調，“子曰大模型不僅可以幫助學生更好地學習，也可以幫助教師更好地教學，一對一的教學更多地變成現實”。

教育、文本潤色改寫、口語陪練，網易有道“子曰”大模型將這些AI熱點幾乎覆蓋了一遍，而在相關測評頁面我們也能發現，棋類教育、編程教育等教育垂類的功能也在開發中。

“子曰”大模型在未來能否成為教育行業的“全能老師”，有待時間驗證。

查看原文

本頁面內容僅供參考，非招攬或要約，也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。

讚賞
點讚
留言
分享

留言

0/400

暫無留言

話題
#PI#
292k 帖子
#BTC#
262k 帖子
#ETH#
171k 帖子
4#GateioInto11#
83k 帖子
5#ContentStar#
69k 帖子
6#GT#
68k 帖子
7#DOGE#
62k 帖子
8#BOME#
62k 帖子
9#MAGA#
53k 帖子
10#SLERF#
51k 帖子