浙江日报数字报纸

00009版：观点

文章导航

北大学生与AI的对决不在输赢

胡欣红

　　■ 胡欣红

　　174名北大学子与全球顶尖AI模型同场竞技，谁能笑到最后？一场特殊的“期中考”引发了舆论关注。据人民日报官微报道，近日，北京大学化学与分子工程学院联合北大计算中心、计算机学院、元培学院团队，发布了最新成果SUPERChem。参与测试的北大化院大二本科生取得了40.3%的平均准确率，而哪怕成绩最好的顶尖模型，也仅与低年级本科生的平均水平相当。

　　在“AI威胁论”甚嚣尘上不时引发恐慌的情形下，这场特殊的“期中考”为我们提供了审视人工智能的清醒视角。最强大脑遇上“北大难度”，精心设计的“图灵测试”，绝非为了彰显AI的短板，而是以科学严谨的方式丈量技术边界，考查AI是否真的“懂”化学，最终指向更深远的技术进步与认知升级。

　　化学作为兼具逻辑推演与空间想象的学科，其晶体结构解析、反应机理推演等任务，恰恰考验着AI从一维文本预测转向多维空间推理的真实能力。当测试结果显示，即便是GPT-5、Gemini等顶尖模型，不仅准确率未能超越人类，还在视觉信息转化、高阶逻辑推理中暴露明显短板。这印证了数学大师丘成桐的判断：“目前人工智能仍然无法实现深度思考，并不具备人类的思考能力，期望它创造崭新观念、实现学科突破目前还不可能。”

　　AI的“厉害”，归根结底是人类智慧的延伸与投射。北大团队搭建协作平台、引入积分激励系统，历经多轮打磨甚至15次迭代才完成试题设计，这种跨学科协作的创造力与精益求精的科学精神，正是AI所缺乏的核心特质。AI模型在训练中吸纳的海量知识，本质上是人类文明的结晶。其在特定任务中的高效表现，不过是人类编程技术、算法设计与数据积累的集中体现。就像这场对决中，AI的每一次答题尝试，都是对人类预设规则与知识体系的被动响应，而北大学子展现的科学直觉、灵活应变与深度思考，才是推动学科发展与技术革新的根本动力。

　　更重要的是，这场“期中考”打破了人们对AI的盲目崇拜，让我们看清技术的本质定位。AI确实在信息检索、数据处理等领域展现出强大优势，但在需要严密逻辑链、深刻理解与创新突破的硬核领域，仍与人类存在显著差距。不过，这类评测不是为了给AI“泼冷水”，而是为技术发展提供精准路标——明确了视觉信息转化、深度推理等短板，全球科研者才能有的放矢地攻关突破，推动AI从“记住知识”向“理解世界”跨越。

　　AI是工具而非对手，是伙伴而非替代者，其发展的高度取决于人类认知的深度与广度。当我们以清醒的认知看待AI，在正视差距中明确方向，在协作创新中补齐短板，才能让这项技术真正服务于人类文明的进步，走出一条更稳健、更长远的发展之路。

　　北大学生与AI的特殊PK，醉翁之意不在“谁输谁赢”。这场“期中考”的真正价值，正在于让我们在技术狂潮中保持理性，在探索未知中坚守初心。毕竟，推动AI走得更远的，永远是清醒认知下的人类力量。

浙江日报 数字报纸

文章导航

北大学生与AI的对决不在输赢

胡欣红

浙江日报数字报纸