界面新闻记者 |
界面新闻编辑 | 宋佳楠
OpenAI还是那个最会玩营销的AI公司 ,早早预告了自己的“12 Days of Christmas ”,这将是其年底最重要的一系列发布会 。
12月6日凌晨,OpenAI年末狂欢“Day 1”开启 ,在山姆·奥特曼的总结下,两项更新最为重磅:o1模型“满血版”,以及价值200美元/月的ChatGPT Pro订阅计划。
相较于三个月前发布的o1-preview,o1的智能水平 、处理速度、多模态能力均有明显变化。
通过模型解决数学竞赛题、编程竞赛题的结果呈现 ,o1对比o1-preview的智能水平普遍上升40%-50%,不过在博士级别科学问题的处理上,o1表现反倒稍逊o1-preview 。
山姆·奥特曼提到 ,o1在处理复杂问题时的重大错误率降低了34%,并且不再是所有难度的问题都会花费较长时间,新版o1会根据问题的难易程度调整处理时间 ,简单问题往往仅需几秒,而非几分钟,这个调整可让用户等待时间普遍下调50% ,也解决了o1模式此前最受诟病的问题之一。
更重要的是,新版o1加入了多模态识别能力。OpenAI对此的展现方式格外“硬核”,o1负责人直接手绘了一张供太空数据中心使用的“太空中太阳能收集流程图”。由于太空中无法水冷 ,员工要求o1计算,如果需要供给1GW的电,多大面积散热片才能维持GPU正常运转 。
10秒之后,o1堆积了满屏的精密计算 ,最终给出了正确的结果:242万平方米。
根据OpenAI的安排,即日起,o1面向ChatGPT Plus和团队用户开放 ,企业和教育用户则需要等到下周。
相比智能水平明显升级的o1,200美元/月的ChatGPT Pro更值得关注 。尽管此前已有传闻,但外界一直惊讶于OpenAI竟然会将一个订阅制收费提升到这么高 ,这是此前基础订阅版本20美元费用的10倍。
实际上,OpenAI对ChatGPT Pro并不敷衍,在这套服务系统中 ,它提供了目前最强的o1 pro mode。
在国际数学奥林匹克预选赛题目(AIME 2024)中,o1 pro正确率达到86,高于o1版本的78 。在编程问题上 ,两者能力以90对89旗鼓相当。不过在处理博士级科学问题上,o1 pro实现了约3%的优势。
为了证明这些个位数性能提升是否值得200美元,OpenAI还通过极其严苛的连续测试来展示o1 pro mode的稳定性与可靠性 。显然,这些能力并不是针对普通需求用户打造 ,而是那些对模型使用体验有同样严格要求的高阶用户。
值得一提的是,在ChatGPT Pro模式下,用户可以无限制使用各种高阶模型 ,包括高级语音模式。
这仅仅是OpenAI连续12天狂欢的第一天,还有超过90%的内容等待解锁 。不过从各种传闻来看,剩余内容中相对重磅的可能是成为“期货 ”已久的Sora。在视频模型上 ,OpenAI终于需要对行业做个更具体的交代了。
还没有评论,来说两句吧...