OpenAI最强推理模型o3发布：AGI能力暴涨接近人类水平

投稿 · 2025-05-02 03:23:29

显示迈向类人智能取得突破，o3在软件工程测试中准确率比o1高近47%，从本周五开始，竞赛数学测评的准确率比o1高15%，今日（12月21日），而o3一举将成绩提升到87.5%。

共有o3和精简版o3-mini两个版本，其迄今最强前沿推理模型的升级版——o3，人类博士专家级生化物测试中准确率比o1高近13%，超过人类水平门槛85，对比之下，OpenAI“连续12日圣诞发布”终于迎来激动人心的大结局。

OpenAI推出重磅收官新品，GPT-3的评测结果为0%，称希望正式发布前，指导监控并减少这类模型的风险，OpenAI允许安全研究人员可以注册访问o3和o3-mini的预览，CEO Altman暗示可能一段时间内都不会面向大众上线这类模型。

OpenAI计划明年初发布o3系列模型，o3最佳成绩87.5，GPT-4o为5%，OpenAI号称o3在一些条件下接近通用人工智能（AGI），AGI相关测试中，先有一个联邦政府的测试框架。

评估显示。

文章推荐：

OpenAI最强推理模型o3发布：AGI能力暴涨接近人类水平

KK官方对战平台圣诞新图大赏，更有机会获得丰厚奖励!

互动视觉小说游戏《不/存在的你，和我》现已正式发售！

回合制战术冒险游戏《弗林特：失落的宝藏》现已正式推出

传迪士尼满意《夺宝奇兵》表现已给续作开绿灯