中国 AI 迎头赶上：DeepSeek 释出 R1 模型，挑战美国技术领先地位

2025-01-26 08:25:35

摘要生成中

中国 AI 实验室 DeepSeek 近期推出了其开源推理模型 DeepSeek-R1，引发了业界广泛关注。该模型被称为「推理模型」，据称在某些 AI 基准测试上，其表现可与 OpenAI 的 o1 媲美。R1 已透过 AI 开发平台 Hugging Face 以 MIT 许可证发布，用户可在无限制条件下将其商业化应用。

DeepSeek 声称，R1 在数个基准测试中超越了 o1，包括美国数学邀请赛（AIME）、MATH-500 和 SWE-bench Verified。其中，AIME使用其他模型来评估推理能力，MATH-500 专注于文字题，而 SWE-bench Verified 则测试程式设计任务。

R1 模型有优势，但受限于政治

据称，作为推理模型，R1 具备独特的自我校验能力，这使其在物理、科学和数学等领域的可靠性优于传统模型。尽管推理模型通常需要更长的运算时间 (几秒至数分钟)，但其高准确率对于处理复杂问题具有极大优势。

技术报告指出，R1 包含 6710 亿个参数，远超许多现有模型。参数量通常与模型的解决问题能力成正比，这使 R1 成为一个规模庞大的模型。然而，D

MATH3.09%

查看原文

本页面内容仅供参考，非招揽或要约，也不提供投资、税务或法律咨询。详见声明了解更多风险披露。

赞赏
点赞
评论
分享

0/400

暂无评论

话题
#BTC#
236959 帖子
#PI#
224309 帖子
#ETH#
151717 帖子
4#GateioInto11#
79560 帖子
5#ContentStar#
66257 帖子
6#GT#
64536 帖子
7#BOME#
60420 帖子
8#DOGE#
58737 帖子
9#MAGA#
52033 帖子
10#SLERF#
50447 帖子