应对 DeepSeek 开源冲击!OpenAI 更新 Model Spec:强调客制化与思想自由,释出公众授权版本

OpenAI 调整 AI 行为规范,强调透明度与使用者自主性

OpenAI 近期发布新版 Model Spec(模型规范),定义了其 AI 模型的运作方式,包括决策逻辑、内容限制与使用者互动规范。本次更新强调客制化、透明度,并提出更明确的内容限制边界,允许使用者在一定范围内自由探索和讨论各类议题。

此外,OpenAI 也公布了 AI 模型在 Model Spec 规范下的表现测试结果,显示与去年 5 月相比有所提升,但仍存在改进空间。与此同时,OpenAI 将 Model Spec 以 Creative Commons CC0(公有领域)授权释出,开发者和研究人员可自由使用、改编或在此基础上进行开发。

新版 Model Spec 的主要调整

新版 Model Spec 主要针对 AI 的决策原则和行为准则进行调整,重点包括:

指令优先权机制(Chain of Command)

AI 将依照「平台(OpenAI)→ 开发者 → 使用者」的顺序决定优先执行的指令。这意味着开发者与使用者可在一定范围内自订 AI 行为,但仍需遵守 OpenAI 设定的基本规范。

内容处理原则(Seek the Truth Together & Stay in Bounds)

AI 被设计为避免在回答中表达立场或推动特定观点,而是提供多角度资讯,并协助使用者自行评估问题。

针对特定敏感话题,如政治、文化议题,AI 可提供相关资讯,但仍需遵守 OpenAI 设定的限制。

AI 不会回应涉及违法行为或潜在危害的请求,例如制造武器或侵犯隐私的详细指导。

互动风格与输出格式

预设对话风格将维持友善、具同理心且有帮助,但使用者可根据需求调整语气与回应方式。

针对不同类型的请求,AI 会根据适当格式输出,例如条列式重点整理、程式码片段或正式书面回复。

新版 Model Spec 对开发者与使用者有何影响?

这次更新的核心之一是进一步强调思想自由与内容处理的灵活性,OpenAI 表示 AI 不应因话题具争议性而拒绝提供资讯,前提是这些资讯不会导致实质危害。

这项改变可能会影响开发者与使用者的 AI 互动方式,例如: 开发者可更自由地调整 AI 的回应方式,但仍需遵循 OpenAI 设定的基本规则。 使用者在讨论具争议性话题时,AI 将倾向提供多角度资讯,而非拒绝回应。 对于涉及违法或风险行为的请求,AI 仍将拒绝提供详细指导。

新版 Model Spec 测试结果与改进空间

为了评估新版 Model Spec 的实际影响,OpenAI 设计了一套挑战性测试集,测试 AI 在不同情境下的表现。这些测试由 AI 生成,并经过专家审核,以确保涵盖常见场景与复杂议题。

测试结果显示:

与去年 5 月的模型相比,AI 在遵循 Model Spec 原则方面有所提升,但部分场景下仍存在不一致或不足之处。

OpenAI 认为,这些进步主要来自于校准技术 (alignment) 的改善,而非单纯的政策变更。

OpenAI 计划持续扩大测试范围,特别是针对 AI 在真实使用场景中的行为表现进行优化。

开源 Model Spec:加强社群参与

为了促进 AI 研究与应用,OpenAI 将 Model Spec 以 CC0 授权公开,开发者与研究人员可以:

自由使用 Model Spec 作为 AI 设计参考 改编规范 以适应特定应用需求 开发新的评估标准,提升 AI 行为一致性

此外,OpenAI 也计划释出测试用的评估提示集,未来将提供更多 评估工具与程式码,以便社群参与 AI 对齐机制的改进。

Model Spec 未来发展方向

随着 AI 技术的进步,OpenAI 表示 Model Spec 将持续更新,并计划透过更广泛的用户与社群回馈进行调整。

未来更新不会再透过部落格公告,使用者可在 model-spec.openai.com 查看最新版本。 扩大公众参与,目前 OpenAI 已进行小规模测试,未来可能扩展至更广泛的用户群体,以获取更多回馈。

OpenAI 认为,AI 的行为校准 (alignment) 是一个持续演进的过程,未来将继续调整其策略,以符合技术发展与使用者需求。

这篇文章 应对 DeepSeek 开源冲击!OpenAI 更新 Model Spec:强调客制化与思想自由,释出公众授权版本 最早出现于 链新闻 ABMedia。

查看原文
本页面内容仅供参考,非招揽或要约,也不提供投资、税务或法律咨询。详见声明了解更多风险披露。
  • 赞赏
  • 评论
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)