光明日报

渝可渝爱，爱在重庆！探索浪漫之旅，追寻情侣梦想！

每日解盘：“V型”逆转！2800点失而复得，创业板指涨近2%-0118

都在唱衰，德国汽车工业真的不行了？

人民热评：“香港月饼香港买不到”，这该咋办？宣和二年被吃掉的“驴头龙”：此物像狗一样大，跟宋江有三点相似，那就是宋江的变身？

OpenAI 推出 o1 系列模型

发布日期：2024-09-19 14:23

来源类型：光明日报 | 作者：Ario

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【新澳精准资料大全】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【天天彩澳门天天彩】【2O24澳彩管家婆资料传真】

【494949澳门今晚开什么】【2024新澳免费资料】 【2004年管家婆资料大全】

介绍 OpenAI o1

2024年9月12日
一系列用于解决复杂问题的新推理模型。功能：经过训练，这些模型在回应之前花更多时间思考。擅长解决科学、编程和数学领域的复杂任务。在国际数学奥林匹克（IMO）和Codeforces等基准测试中表现优异。
发布： OpenAI o1-preview 在ChatGPT和API中发布。预计会定期更新。正在开发中的新评估。
能力：在物理、化学和生物学任务上表现类似博士生。改进的推理模型在IMO资格赛中得分83%（相比GPT-4o的13%）。在Codeforces竞赛中达到了89%的排名。
限制：暂不具备浏览、文件/图像上传功能。在推理任务方面比常规知识任务更强大。

工作原理：

训练过程：模型像人一样在解决问题之前深入思考。不断完善思维过程，尝试不同策略，识别错误。
测试结果：下一次模型更新在推理任务中优于GPT-4o。编程能力在竞争性编程比赛中排名靠前。
应用：在医疗研究、物理学和开发人员多步骤工作流中有很大用处。

安全性：

新的安全训练方法利用推理能力更有效地应用安全规则。
Jailbreaking测试显示显著提升：o1-preview模型得分84，而GPT-4o得分22。
合作：与美国和英国的AI安全研究所达成正式协议，提供早期研究访问和模型评估。
安全框架：包括Preparedness Framework、严格测试、董事会层面的审查。重点确保遵循对齐准则。

目标用户：

应用场景：科学、编程、数学、医疗研究和开发人员的复杂工作流。
领域：量子光学、细胞测序、多步骤软件工作流。

OpenAI o1-mini：

特点：比o1-preview更便宜、更快。专为高效的编码和推理任务设计。比o1-preview便宜80%。针对需要推理但不需要广泛知识的开发者。
能力：专注于编码、调试和推理任务。提供给ChatGPT Plus、Team、Enterprise和Edu用户。

如何使用 OpenAI o1：

访问方式： ChatGPT Plus和Team用户可以访问o1-preview和o1-mini。每周消息限制：o1-preview为30条，o1-mini为50条。 Tier 5的API用户可以访问这两个模型。 o1-mini未来将向ChatGPT免费用户开放。

未来计划：

推理模型的早期预览。
计划功能：添加浏览、文件和图像上传功能。继续开发GPT系列和OpenAI o1系列。

马特·麦考伊：

7秒前：限制：暂不具备浏览、文件/图像上传功能。

Reinhardt：

3秒前：测试结果：下一次模型更新在推理任务中优于GPT-4o。

沃丁：

5秒前：在推理任务方面比常规知识任务更强大。

柳宗元：

4秒前：正在开发中的新评估。