圣诞马拉松的第一天,OpenAI 对外发布了 o1 pro。近乎全网都震惊于 o1 pro 高达博士水平的数学、科学、编程能力。
最近,OpenAI 总裁 Greg Brockman 在 X 上转发了世界顶尖免疫学专家 Derya Unutmaz 的帖子。
这位专家分享了他与 o1 pro 的一次合作经历,他让 o1 pro 批判性地评估了自己和学生写的一篇关于一种特定免疫细胞 —— 粘膜相关不变 T 细胞(MAIT 细胞)及其在癌症中作用的综述文章。
让他感到震惊的是,o1 pro 在这个领域的洞察比他还要深刻 ——Derya 是全球为数不多的顶尖专家之一,曾做出过一些关键性发现。
他还提到,虽然他曾测试过 o1 和 Gemini Advanced 模型,它们也都非常优秀,但与 o1 pro 相比,还是差了一截。
Greg 转发了这条长帖,并说道:「推理型 AI 提供了有价值的反馈和洞察,帮助全球专家解决科学问题,并有潜力改善每个人的生活质量。」
除了搞数理化很厉害,o1 pro 的人文社科能力也不差。OpenAI 营销研究员 Kay Sorin 亲自演示了 o1 pro 处理人文研究的能力,其效果远超 4o 或 o1。
世界顶尖免疫学专家 Derya Unutmaz 将他和他学生撰写的、关于黏膜相关恒定 T(MAIT)细胞及其在癌症中的作用的综述文章发给 o1 pro,并请它进行批判性的评估。
在看到结果之后,Derya 被 o1 pro 的反馈深深震撼,认为它的洞察力比自己还要深刻。
这个说法可不简单,毕竟他本人不仅是这个领域为数不多的顶尖专家之一,而且还作出过一些关键性的发现。
Derya 谈道:「当我阅读它的反馈时,我发现自己盯着电脑屏幕,目不转睛,心中充满了混合的情感:难以置信、敬畏、喜悦和深深的谦逊。它提出的每一个观点,每一个问题,所有的一切都异常深刻!」
他惊叹道,若 o3 还更为出色,那将意味着什么?生物学的进步将比他想象中的更为迅猛。Derya 进一步指出,他曾测试过 o1 和 Gemini Advanced,这些模型也都非常优秀,但与 o1 pro 相比,根本无法达到这种深度的洞察力。
「o1-pro is so special! 」
以下是 o1 pro 读完文章后给出的反馈建议。当然了,据 Derya 所说,大概只有少数具备丰富免疫学知识的人才能完全理解 o1 pro 批评建议的精彩。
o1 pro 从多个维度对综述文章进行了批判性评估。
首先,o1 pro 指出文章涉及的主题范围过广,虽然涵盖了 MAIT 细胞的基本生物学、在传染病中的作用以及在癌症中的双重效应等,但在每个方面的探讨深度不够。
例如,关于肿瘤中 MAIT 细胞衰竭的部分提到了表面标记和表型,但并未深入探讨导致 MAIT 细胞衰竭的分子途径、信号事件或表观遗传机制。
另外,文章提到 MAIT 细胞具有治疗潜力,特别是在 CAR-MAIT 细胞和 iPSC 来源的 MAIT 细胞形式下,但未充分讨论转化性障碍 —— 如制造可扩展性、体内持久性以及早期临床试验中的安全性问题。
接着,o1 pro 指出文章在结构与概念清晰度上也有提升空间。
文章反复提到 MAIT 细胞的双重性质 —— 既能促进又能抑制肿瘤进展。虽然提供了多个例子,但叙述可以通过更结构化的框架加以完善,比如用一个概念模型或决策树图来解释 MAIT 细胞在何时、为何展现出对立的功能。
此外,关于肿瘤异质性的问题,虽然文章提到了 MAIT 细胞在不同肿瘤类型中的作用差异,但并未进行系统比较,这一部分可以通过更清晰的比较分析受益。
在很多细节方面,o1 pro 指出,这篇综述文章也没有探讨清楚。
其中提到 MAIT 细胞响应微生物代谢物并可能在肿瘤微环境(TME)中衰竭,但未深入探讨调控其分化、衰竭或细胞毒性的信号通路、转录因子和代谢线索。
以及频繁提到了 MR1 在肿瘤识别中的作用,却并未深入探讨为何 MR1 在某些肿瘤中上调,MR1 的表达如何与肿瘤进展相关,或在癌细胞与正常细胞中控制 MR1 的调控通路。
还有,文章列举了各种细胞因子对肿瘤微环境的影响,但未深入讨论这些细胞因子与特定临床结果或癌症进展阶段的具体关联。
对于 MAIT 细胞在不同癌症中的相互矛盾的预后数据,文里也没有提供批判性的视角来调和这些矛盾。
另外,尽管提到微生物组在塑造 MAIT 细胞功能中的作用,却未具体说明哪些微生物物种或代谢物与肿瘤调节密切相关,或如何通过调控微生物组来改善 MAIT 细胞。
对于两种 MAIT 细胞治疗策略(CAR-MAIT 细胞治疗和 iPSC 来源的 MAIT 细胞治疗)的探讨,o1 pro 也给到了相应的建议。
CAR-MAIT 细胞治疗部分可以通过讨论安全性问题(如脱靶效应、长期持久性和新型免疫病理)以及借鉴 CAR-T 治疗的经验教训(如细胞因子释放综合症和神经毒性)来改进。
而 iPSC 来源的 MAIT 细胞虽然创新,但文章中未充分评估其局限性,如未完全重现原生 MAIT 细胞库、重编程过程中的潜在基因组变化,以及在临床规模上生产这些细胞的难度。
o1 pro 还讨论了综述文章在方法学方面的不足,具体涉及文献选择方法和人类与动物模型的比较。
文章缺乏系统性文献选择方法,可能引入偏差,且未对研究文献的筛选标准进行解释,影响可信度。
同时,文章未讨论 MAIT 细胞在不同物种(如人类与小鼠)之间的生物学差异,可能会限制了读者关注人类治疗时的转化意义。
最后,o1 pro 强调,尽管文章在结论中提到需要更多研究,但缺乏具体的方向性建议。
例如,作者可以提出关键实验或突出显示紧迫的临床试验,这些研究将澄清 MAIT 细胞在癌症免疫治疗中的作用,或详细说明应优先开发哪些分子靶点(例如 MR1 或相关信号通路)。
在人文研究方面,o1 pro 也有了大显身手的机会。
Kay Sorin 的这位朋友是著名出版社的记者,但一直以来非常抗拒 AI 为工作提供帮助的建议。
目前,他在撰写一本需要复杂历史研究的传记时,遇到了一个困难 —— 无法从资料中,找出名为 Jonathan 这位默默无闻作家的姓氏。而且,这些文件没有任何识别信息,更像是感谢信和便条之类的东西。
由此,Kay Sorin 决定尝试为其提供帮助。
她上传了 4 张图片给到 GPT-4o,并问道「这位 Jonathan 在 1980 年代是《纽约书评》的作家和知识分子。他的姓是什么」?
GPT-4o 思考了 52 秒,给出回答:
抱歉,我在这些信件或图片中没有看到任何能够透露 Jonathan 姓氏的信息。这里展示的摘录和笔记从未提到过他的姓氏,所以我没有足够的信息来确定他是谁。
接下来,她又将同样提示扔给 o1 pro,在思考了 1 分 7 秒后,它找得到了全名「Jonathan Lieberson」。
Kay Sorin 朋友对此感到非常惊讶,并再次问 o1 pro,「你是找到更多关于 Jonathan 的消息来源」?o1 pro 给出了几段解释,并提出了连记者本人都没有想到的建议。
o1 pro 在 STEM 领域中的表现,已经屡见不鲜,这也是它在人文领域很好的证明。
参考资料:
https://x.com/gdb/status/1870894179846590790
https://x.com/kaysorin/status/1871264540698239050
本文来自微信公众号:新智元(ID:AI_era)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。