新版ChatGPT用人类思维推理 OpenAI o1上线可解答逾8成IMO题

加拿大都市网

人工智能新创公司OpenAI推出能够解决复杂推理的新版ChatGPT,定名OpenAI o1。这款新模型能以人类思考方式回答问题,专门应付需要逻辑推理的任务,像是数学和科学。

专门应付逻辑推理任务

OpenAI指出,OpenAI o1在国际数学奥林匹亚(IMO)竞赛中能正确解答83%的题目,相较之下,今年5月上线的GPT-4o仅能正确解答13%的题目。

OpenAI新模型能以人类思考方式回答问题。路透社
OpenAI新模型能以人类思考方式回答问题。路透社

 

新模型能够解决复杂推理问题。网上图片
新模型能够解决复杂推理问题。网上图片

 

OpenAI o1在国际数学奥林匹亚(IMO)竞赛中能正确解答83%的题目。网上图片
OpenAI o1在国际数学奥林匹亚(IMO)竞赛中能正确解答83%的题目。网上图片

 

研究人员示范用OpenAI o1技术解决数学问题。网上图片
研究人员示范用OpenAI o1技术解决数学问题。网上图片

 

OpenAI o1是“草莓”系列人工智能模型。
OpenAI o1是“草莓”系列人工智能模型。

 

GPT-4o在资讯检索方面的表现较为出色,而OpenAI o1则是专门应付需要逻辑推理的任务,而且在回答问题前会花更多时间思考题目,“就像人类一样”。

助医疗研究及电脑开发

OpenAI表示,新的推理功能可用于医疗保健研究人员注释细胞测序数据,物理学家生成复杂公式,或电脑开发人员构建和执行多步骤设计。

OpenAI首席科学家帕乔基和技术研究人员席多在一次展示中,示范用OpenAI o1技术解决一个博士级的化学问题,并根据患者的症状和病史详细报告,诊断出一种疾病。

回答需要时间

帕乔基进一步阐述:“使用像是ChatGPT这种早期模型时,你问它一个问题,它会立即开始回答。但推理模型OpenAI o1需要时间,它能够用英文思考问题,尝试将问题拆解,并寻找解决角度,努力提供最佳解答。”

OpenAI的ChatGPT在2022年底问世,此款对答机械人会出现幻觉和捏造事实的情况,OpenAI一直在尝试解决缺陷;不过席多仍表示,OpenAI o1并不是完美的,这款新的推理模型只是更有可能产生正确答案。

OpenAI在内部使用代号Strawberry(草莓)来指称这个项目,同时将今次宣布的新模型命名为o1和o1-mini。

自周四起,用户可以透过ChatGPT、付费版ChatGPT Plus、Team都能够使用OpenAI o1的预览版本。

share to wechat

延伸阅读

延伸阅读

波音劳资纠纷|工会不满新合约提案 3.3万会员今起大罢工

34岁男血脂高 三酸甘油脂超标5倍 不吃药2个月减80% 吃1种鱼超有效

特朗普“移民吃猫狗论”发酵 俄亥俄州春田市收炸弹威胁

郎心如铁|瑞士名模遭丈夫杀害 遗体被肢解绞碎“打成泥”灭证