新版ChatGPT用人类思维推理 OpenAI o1上线可解答逾8成IMO题

加拿大都市网

2024年9月12日 23:37

人工智能新创公司OpenAI推出能够解决复杂推理的新版ChatGPT，定名OpenAI o1。这款新模型能以人类思考方式回答问题，专门应付需要逻辑推理的任务，像是数学和科学。

专门应付逻辑推理任务

OpenAI指出，OpenAI o1在国际数学奥林匹亚（IMO）竞赛中能正确解答83%的题目，相较之下，今年5月上线的GPT-4o仅能正确解答13%的题目。

OpenAI新模型能以人类思考方式回答问题。路透社

新模型能够解决复杂推理问题。网上图片

OpenAI o1在国际数学奥林匹亚（IMO）竞赛中能正确解答83%的题目。网上图片

研究人员示范用OpenAI o1技术解决数学问题。网上图片

OpenAI o1是“草莓”系列人工智能模型。

GPT-4o在资讯检索方面的表现较为出色，而OpenAI o1则是专门应付需要逻辑推理的任务，而且在回答问题前会花更多时间思考题目，“就像人类一样”。

OpenAI表示，新的推理功能可用于医疗保健研究人员注释细胞测序数据，物理学家生成复杂公式，或电脑开发人员构建和执行多步骤设计。

OpenAI首席科学家帕乔基和技术研究人员席多在一次展示中，示范用OpenAI o1技术解决一个博士级的化学问题，并根据患者的症状和病史详细报告，诊断出一种疾病。

帕乔基进一步阐述：“使用像是ChatGPT这种早期模型时，你问它一个问题，它会立即开始回答。但推理模型OpenAI o1需要时间，它能够用英文思考问题，尝试将问题拆解，并寻找解决角度，努力提供最佳解答。”

OpenAI的ChatGPT在2022年底问世，此款对答机械人会出现幻觉和捏造事实的情况，OpenAI一直在尝试解决缺陷；不过席多仍表示，OpenAI o1并不是完美的，这款新的推理模型只是更有可能产生正确答案。

OpenAI在内部使用代号Strawberry（草莓）来指称这个项目，同时将今次宣布的新模型命名为o1和o1-mini。

自周四起，用户可以透过ChatGPT、付费版ChatGPT Plus、Team都能够使用OpenAI o1的预览版本。