用中科院物理所的考研题来考 GPT-4，它能考上物理所吗

中科院物理所
2023-03-19 11:45

原文标题：《ChatGPT 大升级？它去考研能考上物理所吗？》

3 月 15 日本应是小编勤勤恳恳搬砖的平凡一天，但小编刚睡醒就发现朋友圈被 ChatGPT 刷屏了：

新版 GPT-4 震撼发布！

大升级！强到爆炸！

这些字眼引起了我的兴趣，于是小编迅速入 (ke) 手 (jin) 了 gpt-4，经过简单体验后，小编发现 Chatgpt 的思维深度确实比之前有了跨越式的提升，高中甚至大一大二的知识根本难不住它，于是小编准备对它进行进一步测试...

如果你还不太了解什么是 ChatGPT，可以先看一下我们先前的推送：有人说 ChatGPT 有物理学博士水平？我们的测试结果令人……

在上一篇推送中我们已经简单测试了 ChatGPT 的物理水平，但结果并不尽如人意。它仍停留在对物理学一知半解的阶段，很多知识点仅限于知道，稍微深入就开始顾左右而言他，逻辑思维能力有限，但那是之前的 gpt-3.5 版本。

gpt-4 和 gpt-3.5 在各项考试中的成绩对比

根据官方的宣传，新推出的 gpt-4 在各项考试中的成绩远超 gpt-3.5，在很多专业和学术上的表现达到了人类水平，甚至在 GRE (美国研究生入学考试) 的两科中已经达到了顶尖大学生水准。

于是小编开始好奇：它能征服 GRE，能征服我们物理所的考研题吗？

物理所硕士考试科目

物理所的考研专业课是国科大自主命题。根据往年的情况，专业课单科分数 130 左右（满分 150 分）才能有一定把握考上。

题目来源：国科大官网

由于不同专业的考试要求不同，这里我们就以四大力学中最难的量子力学作为基准来考察一下新版 Chatgpt 的物理水平。至于为什么要选量子力学，因为普物对它已经构不成威胁，测不出它的能力上限，是时候让 Chatgpt 见识一下真正的力量了！

温馨提示：看不懂也不影响你直接拉到文末看结论。

01、量子力学第一题

第一问

第一题的三问都是量子力学基础内容，属于送分题，但从这个答案就可以看出 ChatGPT 是有量子力学功底的：能充分理解我给出的题目，思路清晰正确，加十分！

第二问

本题 Chatgpt 用的方法很奇怪。因为题目没有给出束缚态的具体形式，也就没有值得讨论的对称性，只能勉强给一点分。

实际上定态下力学量的期望值不随时间改变，具体到位移就是 d<x>/dt=0，用海森堡运动方程可以导出 < p>=m*d<x>/dt=0，因此的动量期望为 0。

第三问

本题其实只需要将含时薛定谔方程的解代入定态方程，求出其对时间的导数为 0 就可以，Chatgpt 却大费周章地去求含时薛定谔方程的解，实际上这个结论完全可以直接使用。

而且 Chatgpt 还差临门一脚：证明对时间的导数为 0，不过影响不大。

第一题得分：22 分。

02、量子力学第二题

第一问

首先是本征态没问题，但归一化错了。积分的结果应该用 delta 函数，否则对 1 进行全空间积分就是正无穷。但如果我们跟着 Chatgpt 的错误思路继续做下去，就会看到最后一步化简时 AI 给出了这样的结果：

这个式子的值应当是 1/π。居然会出现这种低级错误，Chatgpt 你还是训练的不够啊！

第二问

第二问用泰勒公式就扯远了。本题两个结论之间是厄米共轭的，只需证明其中之一。解题思路是在两项中插入一个完备集，运算后积分即得结论。

第三问

第三问的过程乍一看还是很合理的，公式本身也没错，但 AI 却套错了公式导致结果错误。正确的公式如下：

第四问

第四问 Chatgpt 的思路没错，只需要将第三问结果平方就能得到结果，但第四问要用到第三问的结论，所以也跟着错了，大概可以酌情给点思路分。

第二题得分：10 分。

03、量子力学第三题

第一问

来看看 Chatgpt 对角动量的理解。

看起来 Chatgpt 并不懂角动量，说了一堆废话以后算出来一个 0，正确的解法应该把球坐标代入波函数，然后整理成球谐函数的形式算出角量子数 l=1。

如果总角动量为 0，第二问的结果直接就是 0，就不需要算了。

第二问

果然，Chatgpt 废话了一大圈以后还是得出了 0，第一问总角动量算错，第二问算分量肯定会算错。

至于第三问，AI 废话说到一半就报错了，所以我就不上截图了。

第三题得分：2 分。

04、量子力学第四题

第一问

第一问的解题思路是对的，然而 Chatgpt 一上来就把哈密顿量给写错了，少了泡利矩阵里的 1/2，因此最后的本征值里多了个 2，且结果没有归一化，但除此以外都是对的。

第二问

第二问是纯粹的本征值计算问题，Chatgpt 的思路非常标准，前期计算也是正确的，但最后算行列式时直接把两个 2c_0 给扔掉了，导致两个能级结果错误。虽然没能全对，能做到这一步已经很厉害了。

第四题得分：25 分

05、量子力学第五题

第一问

第一问是送分题，只要把定态的动量和位移的不确定度代入不确定性关系，由 a^2+b^2≥2ab 就可以导出最小值，Chatgpt 的思路虽然复杂了点，但也没问题，然而它又又又又算错了：

但我们稍加计算就能看出这里的化简结果应当是：

第二问

第二问变分法，Chatgpt 一上来就把归一化常数算错了：

但人类也会犯这种低级错误

很明显，这里 AI 把平方漏掉了，导致后续计算全部错误。不过 AI 给出的过程很标准，条理清晰，值得学习。

第三问

本题直接套升降算符的性质：a_- |0>=0，|1>=a_+ |0>，由第一个式子确定基态波函数，再用第二个式子算出第一激发态。AI 用的也是这个思路，但在下面这一步求导的时候算错了。

第四问

题目已经给出了微扰的矩阵形式，直接算特征值就可以解决问题，但 Chatgpt 又把简单的行列式算错了，算出了 1*1=2 的惊天妙手：

正确的久期方程应该是-λ^3+λ=0，而不是其给出的-λ^3+2λ=0。由久期方程解出 0 和 ±1 三个特征值，因此在微扰下三重简并消除，能级分裂成与特征值一一对应的三个。

第五题总分：18 分。

ChatGPT 总得分：77 分 / 150 分，距离 130 分的目标还有亿点差距，建议第二年再战哦！

此外，我还让 Chatgpt 做了 2021 年的国科大量子力学考研题，它也拿到了约 80 分，而且如果能帮它稍微修正一下计算过程中的错误，就能达到约 100 分水平。毫不夸张地说，Chatgpt 的量子力学已经达到了物理系本科毕业生水平。

06、文献总结

为了进一步测试 gpt-4 的学术能力，我又找了一篇文献来测试 gpt-4 的文献阅读能力，下面是一段由其生成的文献内容总结。

论文链接

Chatgpt 翻译总结的错误较多，比如温度的单位 mK 被翻译成了毫克，也无法理解一些学术名词，比如 1K 池（4He-1K-stage）被翻译成了 1K 级，不认识卡皮查热阻等，参考价值有限。看来学术名词翻译即使对 AI 来说也不是一件容易的事。

但如果让 Chatgpt 以英文输出，则其总结文献内容的能力十分强大，语言流畅逻辑清晰，不过仍会遗漏一些重要信息，所以还不能依赖 AI 来看文献。

目前将论文输入 Chatgpt 比较麻烦，很多时候不如直接看摘要，尚不能为我们阅读文献提供实质性的帮助。如果后续能根据图片或者 pdf 直接给出主要内容，将是其能力的又一次飞跃。

07、新旧版本对比

最后我又对比了一下 gpt-3.5 和 gpt-4 的量子力学能力。面对一维谐振子问题，gpt-4 能完美解决，但 gpt-3.5 就不行。

测试内容相关来源：窝湖边的

不过，面对更复杂的场论中氢原子狄拉克方程与精细结构问题，即使是 gpt-4 也无能为力，只能在说了一堆废话后报错，看来场论的难度已经超过了它的能力上限。综合来看，gpt-3.5 对量子力学仅有大概了解，但 gpt-4 对量子力学有着深入的了解，水平远超 gpt-3.5。

gpt-3.5 和 gpt-4 的对比，第一张截图是 gpt-3.5，后三张是 gpt-4。

总结

经过测试，gpt-4 对量子力学的理解相当深入。它解题的思路清晰准确，但计算能力较差。由于语言模型底层逻辑的限制，它在解题过程中总是犯低级计算错误，因此拿不到高分，也就考不上物理所。但我认为它的总分过国家线不成问题。

虽然 ChatGPT 很难考上物理所，但它的量子力学水平已经接近物理专业的本科毕业生（计算能力除外），令人不得不承认它的强大。不仅如此，从小学中学到本科的题目都可以让 ChatGPT 来解，其不但能提供详细的思路和过程，还能针对你提出的问题加以讲解，善加运用完全可以成为学生的好帮手。

最后，欢迎大家报考中科院物理所哦！

注 1：ChatGPT 网页端目前未开放图片输入，本文并非以图片，而是以输入符号文字的形式来向 ChatGPT 提问的。展示的题目图片是为了方便读者阅读。

注 2：小编没有考研经验，给分比较随意，本文不构成任何考研建议。

本文来自微信公众号：中科院物理所（ID：cas-iop），作者：黄水机

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。