GPT-5破解世纪难题,竟是上网抄来的!哈萨比斯:太尴尬了

2025-10-19 23:04:56 6阅读

OpenAI团队狂吹了一波GPT-5,结果竟是闹剧一场......

事情是这样的。

GPT-5 Pro破解百年悬案 谣言_gpt-5连破10道百年悬案级难题_OpenAI GPT-5破解埃尔德什难题 闹剧

几天前,OpenAI科学家Sebastien Bubeck激动转发,两位研究员联手GPT-5 Pro,仅用了一个周末,破解了10个「百年悬案」——

埃尔德什难题(Erdos problems)

紧接着,OpenAI科学副总裁Kevin Weil等人纷纷加入,大肆宣传。

gpt-5连破10道百年悬案级难题_GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧

然而,真相很快浮出水面:

这十道难题,早就被学界解决,并非由GPT-5独立解决,它只是通过检索网络文献给出了答案。

消息一出,舆论哗然。就连谷歌DeepMind CEO Demis Hassabis也忍不住评价,「这也太尬了」。

gpt-5连破10道百年悬案级难题_OpenAI GPT-5破解埃尔德什难题 闹剧_GPT-5 Pro破解百年悬案 谣言

还有,图灵奖得主LeCun闪现X上嘲讽,「简直就是,搬起石头(GPT)砸自己的脚」。

GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧_gpt-5连破10道百年悬案级难题

GPT-5,一场闹剧

这场闹剧,可以说OpenAI团队的自导自演。

研究人员Mark Sellke和Mehtaab Sawhney发文很明确,并没有说GPT-5破解了难题。

他们原帖是,通过GPT-5数千条查询后,找到了十个被列为Erdos问题的解。

当时的结果是,问题223、339、494、515、621、822、883、903、1043、1079都得到了解决,同时在另外 11 个问题上也取得了部分进展。

GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧_gpt-5连破10道百年悬案级难题

另一方面,这十道难题早已有了答案,只不过网站管理者并未更新。

OpenAI GPT-5破解埃尔德什难题 闹剧_GPT-5 Pro破解百年悬案 谣言_gpt-5连破10道百年悬案级难题

传送门:https://www.erdosproblems.com/

英国皇家学会研究院Thomas Bloom,网站erdosproblems.com运营者,却对此并不知情。

网站上,「开放」状态仅代表他个人并不了解该问题的解法,而不是表示该问题在科学界尚未被解决。

GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧_gpt-5连破10道百年悬案级难题

总言之,两个误会,凑在了一起,让人们产生了「幻觉」——GPT-5攻克了埃尔德什难题。

一方面,难题并非未解决,只是网站维护者不清楚;另一方面,GPT-5仅通过搜索文献完成,并非自己解决。

gpt-5连破10道百年悬案级难题_GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧

Sebastien Bubeck尴尬回复道,GPT-5只是在文献中找到了解决方案,仅此而已。

即便如此,已经非常高效了,因为我知道搜索文献是有多么地困难。

GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧_gpt-5连破10道百年悬案级难题

网友热议,还需同行评审

评论区的大佬们,正坐在前排吃瓜。

gpt-5连破10道百年悬案级难题_GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧

gpt-5连破10道百年悬案级难题_GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧

通过这场争论,开发者Matt Mazur认真地表示,所有人必须谨慎地对待任何关于AI发现新科学/数学成果的说法」。

gpt-5连破10道百年悬案级难题_GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧

Hyperbolic创始人Yuchen Jin称,「关于AI发现科学/数学的新发现,需要更多的同行评审」。

OpenAI GPT-5破解埃尔德什难题 闹剧_gpt-5连破10道百年悬案级难题_GPT-5 Pro破解百年悬案 谣言

不过也有人认为,这对GPT-5来说并不尴尬,毕竟它在文献检索方面表现还是很出色的。

OpenAI GPT-5破解埃尔德什难题 闹剧_GPT-5 Pro破解百年悬案 谣言_gpt-5连破10道百年悬案级难题

几天前,陶哲轩也曾发文表示,我越来越觉得,眼下AI要在数学领域真正发挥作用,关键可能不在用最牛的模型去攻克最难的题目——

当然偶尔会有这种案例,特别是当人们砸了大量算力和专家精力进去的时候。

但更靠谱的路线,反而是用中等水平的AI工具,去帮我们搞定那些研究里绕不开的琐碎活、体力活。

gpt-5连破10道百年悬案级难题_GPT-5 Pro破解百年悬案 谣言_OpenAI GPT-5破解埃尔德什难题 闹剧

无论何时,对AI原创发现保持审慎都是第一位的,但这并不妨碍AI辅助科研成为未来的必经之路。

参考资料:

https://x.com/SebastienBubeck/status/1979539604522127746

https://x.com/thomasfbloom/status/1979254235075059732

免责声明:由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权,根据《信息网络传播权保护条例》,如我们转载的作品侵犯了您的权利,请您通知我们,请将本侵权页面网址发送邮件到qingge@88.com,深感抱歉,我们会做删除处理。