中國 AI 迎頭趕上：DeepSeek 釋出 R1 模型，挑戰美國技術領先地位

2025-01-26 08:25:35

摘要生成中

中國 AI 實驗室 DeepSeek 近期推出了其開源推理模型 DeepSeek-R1，引發了業界廣泛關注。該模型被稱為「推理模型」，據稱在某些 AI 基準測試上，其表現可與 OpenAI 的 o1 媲美。R1 已透過 AI 開發平台 Hugging Face 以 MIT 許可證發佈，用戶可在無限制條件下將其商業化應用。

DeepSeek 聲稱，R1 在數個基準測試中超越了 o1，包括美國數學邀請賽（AIME）、MATH-500 和 SWE-bench Verified。其中，AIME使用其他模型來評估推理能力，MATH-500 專注於文字題，而 SWE-bench Verified 則測試程式設計任務。

R1 模型有優勢，但受限於政治

據稱，作為推理模型，R1 具備獨特的自我校驗能力，這使其在物理、科學和數學等領域的可靠性優於傳統模型。儘管推理模型通常需要更長的運算時間 (幾秒至數分鐘)，但其高準確率對於處理複雜問題具有極大優勢。

技術報告指出，R1 包含 6710 億個參數，遠超許多現有模型。參數量通常與模型的解決問題能力成正比，這使 R1 成為一個規模龐大的模型。然而，D

MATH4.66%

本頁面內容僅供參考，非招攬或要約，也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。

讚賞
點讚
留言
分享

留言

0/400

暫無留言

話題
#BTC#
237067 帖子
#PI#
225196 帖子
#ETH#
151807 帖子
4#GateioInto11#
79574 帖子
5#ContentStar#
66268 帖子
6#GT#
64557 帖子
7#BOME#
60426 帖子
8#DOGE#
58754 帖子
9#MAGA#
52035 帖子
10#SLERF#
50448 帖子