OpenAI 发布下一代推理模型 o1 (传说中的Strawberry)

9/13/2024

https://www.chatbro.cn/news/66e3a6419bd8bad4aefa4684

OpenAI在2024年9月12日发布了一系列新的推理模型，命名为OpenAI o1。这些模型旨在通过更长时间的思考来解决复杂问题，相较于之前的模型，在科学、编程和数学等领域表现出更强的推理能力。

新模型发布：OpenAI o1系列的第一个模型已经在ChatGPT和API中发布，这是一个预览版，预计将会定期更新和改进。
工作原理：这些模型被训练成在回答问题前花费更多时间思考，类似于人类的思考过程。它们通过训练学习优化思考过程，尝试不同的策略，并识别错误。
性能测试：在测试中，新模型在物理、化学和生物学的挑战性基准任务上的表现与博士生相当。在国际数学奥林匹克竞赛（IMO）的资格赛中，新模型的解题正确率远高于GPT-4o。
安全性：OpenAI开发了新的安全训练方法，利用模型的推理能力使其更好地遵守安全和对齐指南。在“越狱”测试中，新模型的安全得分显著高于GPT-4o。
合作与治理：为了匹配新模型的能力，OpenAI加强了安全工作、内部治理，并与联邦政府合作。此外，还与美国和英国的AI安全研究所建立了正式协议。
目标用户：这些模型特别适合需要解决科学、编程、数学等领域复杂问题的用户，例如医疗研究人员、物理学家和开发者。
OpenAI o1-mini：为了提供更高效的解决方案，OpenAI还发布了一个更小、更便宜的推理模型o1-mini，特别适合编程任务。
如何使用：ChatGPT Plus和Team用户可以开始使用o1模型，而ChatGPT Enterprise和Edu用户将从下周开始获得访问权限。API用户也可以开始原型设计。