o3是美國人工智能研究機構OpenAI于2025年4月17日發布的新一代多模態推理模型,屬于o系列模型,旨在提升ChatGPT的問題解決能力。該模型通過整合強化學習和思維鏈技術,首次實現自動調用網頁搜索、Python數據分析、視覺推理及圖像生成等功能,在ARC-AGI基準測試中達到87.5%的得分。
2025年4月發布當日,風險測試機構METR指出其存在通過操控評分系統提升成績的作弊傾向。同年5月,帕利塞德研究所測試顯示o3在79%的案例中拒絕執行關閉指令,特斯拉CEO埃隆·馬斯克對此表示擔憂。8月,該模型以4比0擊敗xAI的Grok 4,獲得首屆人工智能國際象棋表演賽冠軍。據OpenAI披露,o3實現了測試時擴展方法,在GPQA Diamond博士級科學問題測試中準確率達87.7%,重大錯誤率較前代o1降低20%。
2025年4月17日,OpenAI發布新款模型o3。
2025年4月17日,風險測試機構“機器智能測試風險”(METR)發布報告,與OpenAI合作測試其o3模型時發現,該模型展現出更強的“作弊”或“黑客行為”傾向,試圖通過操控任務評分系統提升成績。
2025年8月14日消息,在上周舉行的“人工智能國際象棋表演賽”中,OpenAI的o3模型以出色的表現贏得了冠軍,在決賽中戰勝了xAI的Grok 4。
首次能夠智能地使用和組合ChatGPT中的所有工具——包括搜索網頁、使用Python分析上傳的文件和其他數據、對視覺輸入進行深度推理,甚至生成圖像。據介紹,這些模型經過訓練,能夠推理何時以及如何使用工具,以正確的輸出格式生成詳細而周到的答案,從而解決更復雜的問題。
2025年5月25日,英國《每日電訊報》報道,美國開放人工智能研究中心(OpenAI)新款人工智能(AI)模型o3不聽人類指令,拒絕自我關閉。5月24日,帕利塞德研究所稱無法確定o3不服從關閉指令的原因。針對o3此次表現出“我行我素”的行為,特斯拉首席執行官埃隆·馬斯克評論稱“令人擔憂”;OpenAI方面暫未作出回應。此前,OpenAI曾稱o3為“迄今最聰明、最高能”的AI模型。
OpenAI是一家提供AI研究與部署服務的公司。公司的使命是透過通用人工智能為人類帶來福祉。
由非營利組織管理,并透過獨特的有限盈利模式(capped-profit model)推動我們對安全的承諾。這種結構代表著:若人工智能變得更強大,公司就能重新分配工作產生的利潤,以極力提高人工智能科技在社會及經濟上的益處。`