新版ChatGPT用人類思維推理 OpenAI o1上線可解答逾8成IMO題

加拿大都市网

人工智能新創公司OpenAI推出能夠解決複雜推理的新版ChatGPT,定名OpenAI o1。這款新模型能以人類思考方式回答問題,專門應付需要邏輯推理的任務,像是數學和科學。

專門應付邏輯推理任務

OpenAI指出,OpenAI o1在國際數學奧林匹亞(IMO)競賽中能正確解答83%的題目,相較之下,今年5月上線的GPT-4o僅能正確解答13%的題目。

OpenAI新模型能以人類思考方式回答問題。路透社
OpenAI新模型能以人類思考方式回答問題。路透社

 

新模型能夠解決複雜推理問題。網上圖片
新模型能夠解決複雜推理問題。網上圖片

 

OpenAI o1在國際數學奧林匹亞(IMO)競賽中能正確解答83%的題目。網上圖片
OpenAI o1在國際數學奧林匹亞(IMO)競賽中能正確解答83%的題目。網上圖片

 

研究人員示範用OpenAI o1技術解決數學問題。網上圖片
研究人員示範用OpenAI o1技術解決數學問題。網上圖片

 

OpenAI o1是「草莓」系列人工智能模型。
OpenAI o1是「草莓」系列人工智能模型。

 

GPT-4o在資訊檢索方面的表現較為出色,而OpenAI o1則是專門應付需要邏輯推理的任務,而且在回答問題前會花更多時間思考題目,「就像人類一樣」。

助醫療研究及電腦開發

OpenAI表示,新的推理功能可用於醫療保健研究人員注釋細胞測序數據,物理學家生成複雜公式,或電腦開發人員構建和執行多步驟設計。

OpenAI首席科學家帕喬基和技術研究人員席多在一次展示中,示範用OpenAI o1技術解決一個博士級的化學問題,並根據患者的癥狀和病史詳細報告,診斷出一種疾病。

回答需要時間

帕喬基進一步闡述:「使用像是ChatGPT這種早期模型時,你問它一個問題,它會立即開始回答。但推理模型OpenAI o1需要時間,它能夠用英文思考問題,嘗試將問題拆解,並尋找解決角度,努力提供最佳解答。」

OpenAI的ChatGPT在2022年底問世,此款對答機械人會出現幻覺和捏造事實的情況,OpenAI一直在嘗試解決缺陷;不過席多仍表示,OpenAI o1並不是完美的,這款新的推理模型只是更有可能產生正確答案。

OpenAI在內部使用代號Strawberry(草莓)來指稱這個項目,同時將今次宣布的新模型命名為o1和o1-mini。

自周四起,用戶可以透過ChatGPT、付費版ChatGPT Plus、Team都能夠使用OpenAI o1的預覽版本。

share to wechat

延伸阅读

延伸阅读

摇滚英雄|Bon Jovi桥上拍片意外目睹女子轻生 救人一命获警方发文表扬

火星上发现“笑脸” 科学家相信牵涉生命迹象 原因是......

俄军机相隔5年再环绕日本飞行 日战斗机紧急升空应对

泰北洪灾蔓延至少9死多人失踪 清莱国际机场取消所有航班