OpenAI 发布下一代推理模型 o1 (传说中的Strawberry)
9/13/2024
https://www.chatbro.cn/news/66e3a6419bd8bad4aefa4684
OpenAI在2024年9月12日发布了一系列新的推理模型,命名为OpenAI o1。这些模型旨在通过更长时间的思考来解决复杂问题,相较于之前的模型,在科学、编程和数学等领域表现出更强的推理能力。
要点
-
新模型发布:OpenAI o1系列的第一个模型已经在ChatGPT和API中发布,这是一个预览版,预计将会定期更新和改进。
-
工作原理:这些模型被训练成在回答问题前花费更多时间思考,类似于人类的思考过程。它们通过训练学习优化思考过程,尝试不同的策略,并识别错误。
-
性能测试:在测试中,新模型在物理、化学和生物学的挑战性基准任务上的表现与博士生相当。在国际数学奥林匹克竞赛(IMO)的资格赛中,新模型的解题正确率远高于GPT-4o。
-
安全性:OpenAI开发了新的安全训练方法,利用模型的推理能力使其更好地遵守安全和对齐指南。在“越狱”测试中,新模型的安全得分显著高于GPT-4o。
-
合作与治理:为了匹配新模型的能力,OpenAI加强了安全工作、内部治理,并与联邦政府合作。此外,还与美国和英国的AI安全研究所建立了正式协议。
-
目标用户:这些模型特别适合需要解决科学、编程、数学等领域复杂问题的用户,例如医疗研究人员、物理学家和开发者。
-
OpenAI o1-mini:为了提供更高效的解决方案,OpenAI还发布了一个更小、更便宜的推理模型o1-mini,特别适合编程任务。
-
如何使用:ChatGPT Plus和Team用户可以开始使用o1模型,而ChatGPT Enterprise和Edu用户将从下周开始获得访问权限。API用户也可以开始原型设计。