新版ChatGPT用人類思維推理 OpenAI o1上線可解答逾8成IMO題

加拿大都市网

2024年9月12日 23:37

人工智能新創公司OpenAI推出能夠解決複雜推理的新版ChatGPT，定名OpenAI o1。這款新模型能以人類思考方式回答問題，專門應付需要邏輯推理的任務，像是數學和科學。

專門應付邏輯推理任務

OpenAI指出，OpenAI o1在國際數學奧林匹亞（IMO）競賽中能正確解答83%的題目，相較之下，今年5月上線的GPT-4o僅能正確解答13%的題目。

OpenAI新模型能以人類思考方式回答問題。路透社

新模型能夠解決複雜推理問題。網上圖片

OpenAI o1在國際數學奧林匹亞（IMO）競賽中能正確解答83%的題目。網上圖片

研究人員示範用OpenAI o1技術解決數學問題。網上圖片

OpenAI o1是「草莓」系列人工智能模型。

GPT-4o在資訊檢索方面的表現較為出色，而OpenAI o1則是專門應付需要邏輯推理的任務，而且在回答問題前會花更多時間思考題目，「就像人類一樣」。

OpenAI表示，新的推理功能可用於醫療保健研究人員注釋細胞測序數據，物理學家生成複雜公式，或電腦開發人員構建和執行多步驟設計。

OpenAI首席科學家帕喬基和技術研究人員席多在一次展示中，示範用OpenAI o1技術解決一個博士級的化學問題，並根據患者的癥狀和病史詳細報告，診斷出一種疾病。

帕喬基進一步闡述：「使用像是ChatGPT這種早期模型時，你問它一個問題，它會立即開始回答。但推理模型OpenAI o1需要時間，它能夠用英文思考問題，嘗試將問題拆解，並尋找解決角度，努力提供最佳解答。」

OpenAI的ChatGPT在2022年底問世，此款對答機械人會出現幻覺和捏造事實的情況，OpenAI一直在嘗試解決缺陷；不過席多仍表示，OpenAI o1並不是完美的，這款新的推理模型只是更有可能產生正確答案。

OpenAI在內部使用代號Strawberry（草莓）來指稱這個項目，同時將今次宣布的新模型命名為o1和o1-mini。

自周四起，用戶可以透過ChatGPT、付費版ChatGPT Plus、Team都能夠使用OpenAI o1的預覽版本。