近日,OpenAI 宣布其最新小型推理模型 o3-mini 正式上线!这款面向 STEM(科学、数学、编程)领域优化的小型推理模型,不仅具备低成本、低延迟的特点,还提供强大的逻辑推理能力。在性能上,o3-mini 比前代 o1-mini 更快更准,错误率降低了 39%,成为轻量级 AI 模型中的极具竞争力之作。
自即日起,用户可通过 ChatGPT(含 Plus、Team、Pro 方案)及 OpenAI API 试用 o3-mini,企业版本则预计于 2 月开放。而更令人振奋的是,o3-mini 将首次开放给免费用户体验,用户只需在 ChatGPT 中选择“Reason”模式即可轻松上手。
o3-mini 是 OpenAI 首个支持多项开发者热门功能的小型推理模型,包括:
函数调用(Function Calling) — 实现 AI 与应用程序的无缝集成
结构化输出(Structured Outputs) — 输出 JSON、表格等结构化数据
开发者消息(Developer Messages) — 增强 API 交互体验
流式响应(Streaming) — 支持即时流式输出,提升互动效率
这些功能使 o3-mini 能直接应用到生产环境中,开发者可以快速整合到应用程序或服务中。
开发者可以根据实际需求选择以下三种推理模式:
低推理模式(Low) — 响应最快,适合简单任务
中推理模式(Medium) — 平衡速度与准确性,适用于大多数应用场景
高推理模式(High) — 适合复杂计算与更全面的分析
这让 o3-mini 在处理常规问题时快速高效,同时在复杂问题面前也能深入推理,极大提升其应用灵活性。
实验结果表明,o3-mini 的性能在 STEM 领域尤为突出,较前代 o1-mini 精准度显著提升:
数学(AIME 2025 测试) — 高推理模式下准确率达 83.6%
博士级科学问答(GPQA Diamond 测试) — 高推理模式准确率 77%
研究级数学(FrontierMath 测试) — 高推理模式解决 32% 难题,其中 28% 属高难度问题(T3)
编程竞赛(Codeforces 测试) — Elo 分数达 2073,胜过 o1-mini
软件工程(SWE-bench 测试) — 高推理模式下准确率达 48.9%
通过这些表现,o3-mini 显示出其在数学、科学和编程等技术领域的强大优势,能够帮助开发者处理高难度问题。
与 o1-mini 相比,o3-mini 的响应速度大幅提升 24%:
⏱ o3-mini 平均响应时间:7.7 秒
⏳ o1-mini 平均响应时间:10.16 秒
这种提升使 o3-mini 能更快解决复杂问题,尤其适用于实时应用场景,如聊天机器人和客户服务系统。
为了让更多用户体验 o3-mini 的强大功能,OpenAI 提升了 ChatGPT Plus 和 Team 用户的配额:
Plus 和 Team 订阅者 — 每日消息上限从 50 增加到 150 条
Pro 订阅者 — 可无限次访问 o3-mini 和 o3-mini-high 模式
此外,o3-mini 还支持 即时搜索功能,能够提供带来源的最新答案,标志着 OpenAI 在整合搜索技术上实现新突破。
现在,所有用户都能通过以下方式体验 o3-mini:
免费用户 — 在 ChatGPT 中选择“Reason”模式,或重新生成回答即可体验
Plus、Team、Pro 用户 — 直接在 ChatGPT 内选择 o3-mini 模式,享受更高效能与更快响应
API 权限等级 3-5 的开发者可访问 Chat Completions API、Assistants API、Batch API
企业版用户计划于 2 月 获得完整权限
开放的版本包括:
o3-mini(标准版) — 提供中等推理模式,适合大多数使用场景
o3-mini-high(高推理版) — 适合更复杂场景,仅限 Pro 用户访问高推理模式
OpenAI 表示,o3-mini 的发布标志着小型推理模型进入了一个全新阶段,为开发者、科学家、数学家、程序员及普通用户提供了更高效、更精准的 AI 推理解决方案。这一工具的推出将极大提升生产力,并帮助用户快速解决复杂问题。