免费、绿色、专业的手机游戏中心下载安装平台-游家吧

当前位置: 首页 > 教程攻略 > AI 答 IMO 难题坦承“不会”,OpenAI 称“这就是自我意识”

AI 答 IMO 难题坦承“不会”,OpenAI 称“这就是自我意识”

时间:2025-08-04

甜瓜游乐场15.0版本自带模组
  • 类型:角色扮演
  • 大小:90.0mb
  • 语言:简体中文
  • 评分:
查看详情

AI 答 IMO 难题坦承“不会”,OpenAI 称“这就是自我意识”

这一次,“不会”竟成了大模型的高光时刻。

虽然在 IMO 第 6 题上得了零分,OpenAI 的金牌模型却展现了“高智商的诚实”。

正如 OpenAI 研究员 Noam Brown 在最新访谈中所揭示的:

当 IMO 推理模型会在缺乏有效证据时表示“我不确定”,这会显著减少隐藏错误。

在 AI 获得 IMO 奖项后,OpenAI 其中三位精英成员Alex Wei、Sheryl Hsu和Noam Brown参与了一场由红杉资本举办的对话,分享了模型解决复杂数学难题背后的突破性技术。

有网友帮忙总结了个太长不看版:

不同于过去那种假模模胡糊的答案,这代大模型开始敢于承认自己并不了解。

它预示着模型正迈向一种全新的、基于信任和自我认知的回答模式。

三位成员还在这场对话中,分享了更多关于冲刺 IMO 的有趣细节。

IMO 金牌模型能承认自己不知道

尽管数学家与计算机科学家一致认可 IMO 金牌模型的价值。

但他们常常抱怨,当模型遇到知识盲区时,它总会输出一个令人信服但错误的答案。

他们不得不耗费大量精力逐行验算,才能甄别那些幻觉陷阱。

IMO 第 6 题让大模型全军覆没,当然,OpenAI 也对其进行了大量计算。

有一个由 个单位正方形组成的网格。Matilda 的目标是放置一些矩形图块,这些图块的尺寸各异但每一侧均位于网格线之上,并确保每个单位正方形恰好被一个图块完全覆盖。

网格的每一行和每一列都恰好有一个未被任何瓷砖覆盖的单位正方形,求出 Matilda 需要放置的最少瓷砖数量。

虽然投入海量算力最终仅得到一句“我无法回答”令人有些失望,但 Alex Wei 表示:

能看到模型避免产生幻觉是很好的。

Noam Brown 也对模型的这一转变表示赞赏,“如果它不知道,它就会承认它不知道。”

这代表模型开始具备“自我意识”。

这种“自我认知”能力让模型能够意识到自己的局限性,并避免提供误导性的答案,从而提高决策的质量和准确性。

有趣的是,在 Alex Wei 2024 年刚加入 OpenAI 一周时,Noam Brown 就曾问过他,团队何时能获得 IMO 金牌。

当时 Alex Wei 认为 2025 年不太可能实现。

但令人惊叹的是,这个三人团队仅用了两月,就完成了他们一直在追求的目标 DDIMO 金牌。

Noam Brown 还表示:

OpenAI 有一个很棒的地方,就是研究人员有很大的自主权去做他们认为有影响力的研究。

Alex指出,他们团队专注于通用技术而非为特定比赛定制解决方案。

OpenAI IMO 金牌核心团队

OpenAI IMO 核心团队仅由三名研究人员构成。

Alex Wei,本硕均就读于哈佛大学,随后在加州大学伯克利分校获得计算机科学博士学位。

Alex在谷歌、微软与Meta实习,加入OpenAI,现为研究科学家。他是FAIR团队成员,参建了首个可匹敌人类的外交游戏AIDDC-ICERO。

Sheryl Hsu从斯坦福大学毕业并投身于人工智能研究,在OpenAI工作直至。

Noam Brown本科毕业于美国罗格斯新泽西州立大学新布朗斯维克分校,随后在卡内基梅隆大学获得硕士和博士学位。他在DeepMind与Meta工作过,于加入OpenAI。

参考链接:

[1]https://x.com/chatgpt21/status/1950606890758476264

[2]https://www.youtube.com/watch?v=EEIPtofVe2Q

本文来自微信公众号:量子位(ID:QbitAI),作者:时令

精品推荐

相关文章

最新资讯

热门文章

更多