AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登场-郑州世美花卉技术有限公司

　　例如在预设条件的写诗任务（例如第二句的最后一个单词需要以i收尾）中，“拿起笔就写”的GPT-4o的确给出了回答，但往往只会满足了一部分条件，同时不会自我纠正。这意味着AI必须在第一次生成时就能碰上正确的答案，否则就一定会出错。但在o1模型中，AI会不断试错并打磨答案，从而显著提高生成结果的准确率和质量。

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登场

　　有趣的是，点开AI思考的过程，还会出现AI表示“我在思考这个事情这么做行不行”、“啊时间不够了得尽快给出答案”等。OpenAI确认，这里展示的并不是原始的思维链，而是“模型生成的摘要”，公司也坦率承认这里有保持“竞争优势”的因素。

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登场

　　OpenAI的研究负责人Jerry Tworek透露，o1模型背后的训练与之前的产品有着根本性的区别。之前的GPT模型旨在模仿其训练数据中的模式，而o1的训练旨在让其独立解决问题。在强化学习的过程中，使用奖励和惩罚机制来“教育”AI使用“思维链”来处理问题，就像人类习得拆解、分析问题的方式一样。

　　根据测试，o1模型在国际数学奥林匹克的资格考试中，能够拿到83%的分数，而GPT-4o只能正确解决13%的问题。而在编程能力比赛Codeforces中，o1模型拿到89%百分位的成绩，而GPT-4o只有11%。

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登场

　　OpenAI表示，根据测试，在下一个更新的版本中，AI在物理、化学和生物学的挑战性基准测试中，表现能够与博士生水平类似。

　　该讲讲缺点和局限性了

　　不难理解，会自己思考问题的AI模型，对于程序员、创意工作者，以及几乎所有的理科相关专业工作者而言是有益的升级，但这个新模型也有局限性。

　　首先，OpenAI o1模型（至少目前）还不是多模态大模型，同时在回答事实性问题时也不如其他模型。所以在图像互动、常识问答、互联网搜索方面，GPT-4o依然是更胜一筹的选择。当然，OpenAI明确表示未来会给这个模型增加联网、文件和图像上传等功能。

　　另一个问题则是贵，而且是非常贵。o1-预览模型的定价是每百万个输入tokens 15美元，每百万个输出tokens 则要60美元，分别是GPT-4o的3倍和4倍。一百万tokens大致相当于75万个英文单词。

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登场

　　除了OpenAI o1-预览版外，OpenAI也同步推出了o1-mini模型。后者是一个更快、更便宜的模型，定价也会便宜80%，适用于需要推理但不需要广泛世界知识的场景。

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登场

　　而且从OpenAI“抠抠索索”的举动来看，这个推理模型恐怕非常消耗算力。公司宣布，从9月12日起，ChatGPT订阅用户可以访问这两个新模型，但目前o1-preview每周消息数量限制为30条，o1-mini则为50条。

　　企业版ChatGPT和教育用户可以从下周开始访问这两个模型。API使用等级达到5级的开发者可以立即开始使用这两个模型，每分钟的速率限制为20次。OpenAI未来准备向免费用户提供o1-mini模型，但目前还没有时间表。

标签：

上一篇：管家婆一和中特,微山县留庄镇举办纪法警示教育展

下一篇：内部免费一肖一码,国家植物园里有什么？走进植物界的“活化石”水杉

郑州世美花卉技术有限公司推荐阅读：