亚洲美女一区二区三区-亚洲国产一区在线-久草资源在线-免费在线毛片-国产视频www-天天射天天干

量子位 14小時前

AI 答 IMO 難題坦承“不會”，OpenAI：這就是自我意識

這一次，" 不會 " 竟成了大模型的高光時刻。

雖然在 IMO 第 6 題上得了零分，OpenAI 的金牌模型卻展現了 " 高智商的誠實 "。

正如 OpenAI 研究員 Noam Brown 在最新訪談中所揭示的：

當 IMO 推理模型會在缺乏有效證據時表示 " 我不確定 "，這會顯著減少隱藏錯誤。

在 AI 摘下 IMO 金牌后，OpenAI 金牌小分隊成員 Alex Wei、Sheryl Hsu 和 Noam Brown 參與了紅杉資本組織的一場對話，揭秘模型攻克精英數學難題的底層突破。

有網友幫忙總結了個太長不看版：

與過去那些 " 看起來完美，實則錯誤 " 的幻覺式答案不同，這一代大模型開始學會 " 承認自己不會 "。

它標志著模型正在從胡編亂造的幻覺式回答，轉向更加可靠且具有 " 自我認意識 " 的全新階段。

三位成員還在這場對話中，分享了更多關于沖刺 IMO 的有趣細節。

IMO 金牌模型能承認自己不知道

盡管數學家與計算機科學家一致認可 IMO 金牌模型的價值。

但他們常常抱怨，當模型遇到知識盲區時，它總會輸出一個令人信服但錯誤的答案。

他們不得不耗費大量精力逐行驗算，才能甄別那些幻覺陷阱。

IMO 第 6 題讓大模型全軍覆沒，當然，OpenAI 也對其進行了大量計算。

有一個由 2025 × 2025 個單位正方形組成的網格。Matilda 希望在網格上放置一些矩形圖塊，這些圖塊的大小不同，但每個圖塊的每一條邊都位于網格線上，并且每個單位正方形最多被一個圖塊覆蓋。

網格的每一行和每一列都恰好有一個未被任何瓷磚覆蓋的單位正方形，求出 Matilda 需要放置的最少瓷磚數量。

雖然投入海量算力最終僅得到一句 " 我無法回答 " 令人有些失望，但 Alex Wei 表示：

能看到模型避免產生幻覺是很好的。

Noam Brown 也對模型的這一轉變表示贊賞，" 如果它不知道，它就會承認它不知道。"

這代表模型開始具備 " 自我意識 "。

這種 " 自我意識 " 可以幫助模型在面對困難問題時，承認自己的無能為力，而不是生成一個看似合理實則錯誤的解決方案。

有趣的是，在 Alex Wei 2024 年剛加入 OpenAI 一周時，Noam Brown 就曾問過他，團隊何時能獲得 IMO 金牌。

當時Alex Wei認為 2025 年不太可能實現。

但令人驚嘆的是，這個三人團隊僅用了兩月，就完成了他們一直在追求的目標—— IMO 金牌。

Noam Brown 還表示：

OpenAI 有一個很棒的地方，就是研究人員有很大的自主權去做他們認為有影響力的研究。

Alex 還強調，他們的團隊 " 真正優先考慮通用技術 "，而不是專門開發用于數學競賽的系統。

OpenAI IMO 金牌核心團隊

OpenAI IMO 核心團隊僅由三名研究人員構成。

Alex Wei，本碩均就讀于哈佛大學，隨后在加州大學伯克利分校獲得計算機科學博士學位。

Alex 還曾在谷歌、微軟和 Meta 實習，后于 2024 年 1 月加入 OpenAI，現任研究科學家。他曾是 FAIR 團隊成員，參與開發了首個用于外交游戲的人類級人工智能—— CICERO。

Sheryl Hsu，畢業于斯坦福大學計算機科學專業，是斯坦福 AI 實驗室中 IRIS 實驗室的研究員，于 2025 年 3 月加入 OpenAI。

Noam Brown，本科就讀于美國羅格斯新澤西州立大學新布朗斯維克分校，隨后在卡內基 · 梅隆大學獲碩士和博士學位。他曾任職于 DeepMind 和 Meta，于 2023 年 6 月加入 OpenAI。

參考鏈接：

[ 1 ] https://x.com/chatgpt21/status/1950606890758476264

[ 2 ] https://www.youtube.com/watch?v=EEIPtofVe2Q

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法！

— 完 —

希望了解 AI 產品最新趨勢？

量子位智庫「AI 100」2025 上半年

「旗艦產品榜」和「創新產品榜」

給出最新參考

點亮星標

科技前沿進展每日見

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

相關標簽

人工智能斯坦福

《人民日報》：英偉達讓我怎么相信你！黃仁勛要拿出芯片沒后門鐵證

快科技 20分鐘前

庫克正式超越喬布斯！成為蘋果史上任期最長CEO：執掌5091天

數碼測評 7小時前

最新安卓手機性能榜發布：紅魔10S Pro+穩居第一

快科技 9小時前

“AI變革生產力，讓創意更有價值”——2025 AI+娛樂科技大會圓滿召開

36氪 9小時前

折疊屏拐點，始于「0.1mm」的戰爭

36氪 10小時前

Manus還活著，還上新了

讀覽精華 1小時前

比亞迪公布全新機器人專利：自動充電、充氣

快科技 12小時前

歐亞24國可以用高德打車了：無需換SIM卡、無需下載新APP

快科技 12小時前

上海大廠今日首曝：35年無人超越，它的新作想重回巔峰

游戲葡萄 7小時前

光子盒研究院研報：2025年全球量子計算新進展深度分析

鈦媒體 13小時前

529元超高性價比！AOC新款23.8英寸顯示器上架：144Hz全高清電競屏

快科技 13小時前

連續6年霸氣包館！高通驍龍為何對ChinaJoy情有獨鐘

快科技昨天

華為Pura 70 Pro掉進黃河：泡水24小時還沒關機

快科技昨天

回擊大疆全景相機！影石Insta360 X5 首降500元：到手價3298元起

快科技昨天

量子位

覺得文章不錯，微信掃描分享好友

亚洲美女一区二区三区-亚洲国产一区在线-久草资源在线-免费在线毛片-国产视频www-天天射天天干

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業展廳解決方案

元宇宙藝術展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

AI 答 IMO 難題坦承“不會”，OpenAI：這就是自我意識

宙世代

一起剪

相關閱讀

《人民日報》：英偉達讓我怎么相信你！黃仁勛要拿出芯片沒后門鐵證

庫克正式超越喬布斯！成為蘋果史上任期最長CEO：執掌5091天

最新安卓手機性能榜發布：紅魔10S Pro+穩居第一

“AI變革生產力，讓創意更有價值”——2025 AI+娛樂科技大會圓滿召開

折疊屏拐點，始于「0.1mm」的戰爭

Manus還活著，還上新了

比亞迪公布全新機器人專利：自動充電、充氣

歐亞24國可以用高德打車了：無需換SIM卡、無需下載新APP

上海大廠今日首曝：35年無人超越，它的新作想重回巔峰

光子盒研究院研報：2025年全球量子計算新進展深度分析

529元超高性價比！AOC新款23.8英寸顯示器上架：144Hz全高清電競屏

連續6年霸氣包館！高通驍龍為何對ChinaJoy情有獨鐘

華為Pura 70 Pro掉進黃河：泡水24小時還沒關機

回擊大疆全景相機！影石Insta360 X5 首降500元：到手價3298元起

最新評論

量子位

熱門推薦