陶哲轩使用GPT-4解决数学难题

作者: 衡宇 萧箫

来源: 量⼦位

发布日期: 2023-06-26 12:33:50

陶哲轩在解决一个数学难题时使用了GPT-4,并分享了与GPT-4的对话记录,展示了GPT-4在数学研究中的应用,如提供灵感、查找资料等。陶哲轩还分享了使用ChatGPT和GPT-4的经验,强调了AI在数学研究中的潜力,并预测未来AI将成为值得信赖的研究伙伴。

天才数学家陶哲轩搞数学研究,已经离不开普通⼈⼿⾥的“数学菜鸡”GPT了!就在他最新解决的⼀个数学难题下⾯,陶哲轩明确指出⾃⼰“使⽤了GPT-4”,后者给他提出了⼀种可⾏的解决⽅法。借助GPT-4,他不仅成功地突破了这⼀难题,还将答案分享在了MathOverflow上:它给我提供了最终的解题思路,接下来我只需要继续计算就⾏。

为了给更多数学家分享⽤GPT-4⼯作的便利性,陶哲轩还将⾃⼰的聊天记录po了出来,⾥⾯完整地记载了他和GPT-4的对 话。可以看⻅,在这份聊天记录中,他把GPT-4称呼为“专业数学合作者”,⽽不仅仅是⼀个普通的数学助⼿。这个身份属实不⼀般了,不知道之后陶哲轩写论⽂的时候会不会把GPT-4列为共同作者(⼿动狗头)。

不仅如此,戳对话记录底部的“continue this conversation”按钮,还能⼀键把对话记录导⼊⾃⼰的ChatGPT中,突然闯⼊ ⼈类⼤师和AI的交谈。陶哲轩研究的问题,是⼀个两天前在数学⽹站MathOverflow上更新的提问。

这个名叫“优雅的递归之A301897”问题,具体⻓这样:其中,A301897是⼀个被整数数列⽹站OEIS收录的数列:这个数列中有⼀系列来⾃⻓度为n的排列b的数,它们有⼀个共同点,就是满⾜Diaconis-Graham不等式且等号成⽴。

Diaconis-Graham不等式由戴康尼斯(Persi Diaconis)和葛⽴恒(没错,就是“最⼤数”之⽗Ronald Graham)于1977年共同提出,属于概率统计⽅⾯的研究。显然,这⼀⼤段提问中不仅夹杂着⼤量专业数学公式,⽽且还涉及需要跳转的⽹⻚资料。作为数学公认不太好的“数学菜鸡”,GPT-4真的能像⼀名专业数学家那样快速读懂公式、给出解决问题的专业建议吗?

事实上,相⽐直接把问题复制粘贴给GPT-4,陶哲轩做了三件事:⾸先,做⼀些提示⼯程,明确GPT-4的“身份”和“⽬标”。其中身份是“⼀个擅⻓给技巧性建议的数学合作专家”,⽬标是“提供⼀些建议”⽽⾮解决问题。然后,相⽐直接把⼤段公式复制进GPT-4提问栏(确实可以这样做),陶哲轩选择将问题描述转成Markdown格式。

最后,涉及需要GPT-4⾃⼰查找资料的内容,陶哲轩将它转变成⼀个引⽤注释,并在结尾给出⽹址。完整的提问过程⻓这样:也就是说,相⽐让GPT-4直接化身数学家去“解决问题”,陶哲轩只是把它当成⼀个提供灵感来源的“专家”,给⾃⼰建议⼀ 些研究的⽅向。GPT-4很快给出了8个具体的建议:1、理解问题:在深⼊证明之前,确保你理解了问题中的每⼀项。

如果你不熟悉Diaconis-Graham不等式,研究⼀下它,了 解表达式a(n)和R(n, q)中的每⼀项代表什么。2、简化表达:有时候,复杂的表达可以被简化。例如,你可能想看看表达式中a(n)的⼆项式系数是否可以简化,或者是否 可以⽤更简单的⽅式计算总和。3、归纳法:由于R(n, q)是递归定义的,因此证明猜想的⼀种⾃然⽅法是使⽤数学归纳法。

你可能想要证明,如果这个猜想 对n成⽴,那么它对n+1也成⽴。4、⽣成函数:另⼀种⽅法是使⽤⽣成函数。尝试找到a(n)和R(n, 0)的⽣成函数,然后证明它们是相等的。这有时可以把⼀ 个复杂的组合问题变成⼀个更简单的代数问题。5、渐近分析:正如你提到的,分析a(n)和R(n, 0)的渐近⾏为可能会对它们的关系有⼀些深⼊的了解。

这有时可以⽤斯特林 的阶乘近似来实现,或者通过分析表达式中的主导项来实现。6、数值证据:虽然不是证明,但收集数值证据有时可以让我们了解如何证明⼀个猜想。因为你有PARI/GP代码,可以⽤ 数值来检查猜想,你可能想读⼀读每个序列的前⼏项,看看是否能发现任何模式。7、寻找类似问题:有时,⼀个问题或猜想是⼀个已知问题的泛化或变体。在组合⽂献中寻找类似的问题或定理,看看它 们的证明是否可以适⽤于这个问题。

8、寻求反馈和合作:不要犹豫,从同事那⾥寻求反馈,或者在MathOverflow这样的论坛上发布你的部分结果。协作和同 ⾏评议通常是解决复杂数学问题的关键。最终,陶哲轩使⽤建议4,也就是⽣成函数的⽅法,成功解决了问题。当然,解决问题的过程并不需要⽤到GPT-4,采⽤MAPLE⼯作表+纸笔⼿动计算就能完成。陶哲轩也尝试了渐进分析(建议5)的⽅法,不过事实证明还是⽤⽣成函数更有效。

简单来说,陶哲轩只是⽤GPT-4给⾃⼰提供不同的解题思路,也就是“解题灵感”,但具体怎么解答,也就是更加数学的⽅ 法,他则不会交给GPT-4来完成。⾄于“查资料”这种GPT-4的应⽤,陶哲轩也发挥到了极致。例如在思考问题时,他还会把⾃⼰的“灵光乍现”拿出来和GPT-4讨论⼀下,例如他觉得这个问题和卡特兰数(Catalan numbers)有相似之处,希望GPT-4帮他查找⼀下对应的资料。

GPT-4很快给出了对应的回答,这也促使陶哲轩对另⼀个问题产⽣了新的灵感。简单来说,陶哲轩在短短两段与GPT-4的对话中,展示了数学家使⽤GPT-4的正确姿势——找灵感和查资料。这样⼀来,即使“数学菜鸡”如GPT-4,也能成为数学家的AI助理了。分享⼈类⼤师和AI的聊天记录之余,陶哲轩的乳⻮象博⽂⾥还附带着⼀份贴⼼指南,是他使⽤ChatGPT和GPT-4的经验之 谈。

根据他过去的实操经验,最要紧的第⼀点:不要试图让AI直接回答问题,因为这⼏乎肯定会得到⼀些看起来专业的废话。为了避免GPT成为废话⽂学⼤王,⾏之有效的⽅案如下:让AI扮演合作者的⻆⾊,⽽后让它提供策略建议。Like this:除此之外,“数学菜鸡”GPT,在⼤数学家⼿⾥能有什么⽤处?陶哲轩⼤概的意思是酱婶⼉的:ChatGPT数学能⼒虽然不咋滴,但对做学术研究的⼈来说是个发散思维的好⼯具。

(对普通⼈来说有点不太专业,但对搞数学的学术⼈员来说刚刚好)怎么解释⽤来“发散思维”这句话呢?陶哲轩表达出来的观点是,既然ChatGPT在具体数学问题上给出的答案是不完全正确的,那不如索性发挥发挥它⽣成答案 部分正确的特性。简⽽⾔之,就是让它帮你找灵感balabalabla:在处理数学问题时,可以让ChatGPT这类⼤语⾔模型做⼀些半成品的语义搜索⼯作。

也就是说,ChatGPT不⽤提供确切的答案,只⽤⽣成⼀些可能的提示。这样⼀来,依据GPT⽣成的提示+传统搜索引擎搜索,就能很轻松get答案。⽽且他还⾃曝,在GPT-4发布之前,他本⼈就从微软那⾥获得了访问资格。也就是和微软154⻚《AGI的⽕花》论⽂⾥同款,未经过安全训练但能⼒更强的满⾎版。

从陶哲轩的反馈中可以看到,GPT-4⾮常擅⻓在和⼈类对话时进⾏⼀些cosplay,⽐如充当富有同情⼼的倾听者、热情洋溢 的反馈者、富有创造⼒的灵感来源、翻译者或教师,或者是魔⻤的代⾔⼈。

与此同时,对于AI在数学研究中的表现,陶哲轩给出的⼤胆却⼜严谨的预⾔:当与形式证明验证器、互联⽹搜索和数学符号包等⼯具整合时,2026年的AI,如果使⽤得当,将成为数学研究中值得信 赖的共同作者,⽽且在许多其他领域也是如此。除了数学研究,GPT-4已经是陶哲轩⽣活中的全⽅位⼩助⼿了。他经常使⽤GPT-4回答⼀些随意、措辞含糊的问题,这些问题以前需要在搜索引擎⾥精⼼调整关键词才⾏。

还有位同事,因为亲戚拿到重症诊断⽽郁郁寡欢。为此,陶哲轩让⼤⼿⼀挥,让GPT-4洋洋洒洒写了封慰问信。结果呢?同事眼含热泪,被感动哭了。最后说回陶哲轩⽤GPT-4解决数学难题这事⼉上来。在MathOverflow下,有的⽹友觉得他不应该⽤GPT来回答数学问题,感觉是个很敏感的话题。

但还是有⼈表示了资瓷,表示觉得真的是泰库辣~陶哲轩倒是毫不避讳地站出来表明了⾃⼰的⽴场,他倒不觉得有啥不好:现在的担忧,跟维基百科流⾏初期时⼤家讨论的重点也没啥区别……现在在维基百科上get初始线索,并且在引为论点时附上链接,展现它是我论据的⼀部分,都是⼤伙⼉习以为常的事情。

并且陶哲轩看法还挺坚定,那就是“相信⼤家以后也会觉得⽤GPT来⽀持研究,没啥不妥当的呢”~加⼊陶哲轩和GPT-4的对话:https://chat.openai.com/share/53aab67e-6974-413c-9e60-6366e41d8414参考链接:https://mathoverflow.net/questions/449361/elegant-recursion-for-a301897https://mathstodon.xyz/@tao/110601051375142142https://finmath.stanford.edu/~cgates/PERSI/papers/77_04_spearmans.pdf|点击关注我??记得标星|

UUID: d1a8ff14-e1a9-445a-82ad-31ee730e25a7

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2023年/学术头条_2023-06-26_陶哲轩甩出调教GPT-4聊天记录,点击领取大佬的研究助理.txt

是否为广告: 否

处理费用: 0.0099 元