浙江日报数字报纸

00007版：观点

文章导航

对AI大模型，可以对比无需拉踩

佘宗明

　　继百度发布“文心一言”、360展示“360智脑”后，阿里也正式发布了大模型产品“通义千问”。4月11日，在2023阿里云峰会现场，阿里巴巴有关负责人表示，阿里巴巴所有产品未来将接入“通义千问”，进行全面改造，并称阿里云将把AI基础设施和大模型能力向所有企业开放，共同推动AI产业发展。

　　阿里正式推出“通义千问”，意味着通用AI赛道有了更多“中国选手”。考虑到动辄超千亿参数的大模型研发不是个单一的算法问题，而是囊括了底层算力、网络存储、数据清洗与治理、AI框架、人类调优等多个方面的系统性工程，AI技术研发又攸关国家数字主权、未来科技竞争，不少中国科技企业加入AI大模型卡位战中，也是好事一桩。

　　可以看到，国内多家企业的AI大模型都在跃跃欲试，这跟国外同样激烈的竞争节奏遥相呼应。一众科技公司在AI上的“军备竞赛”，反映的是抢占AI技术及产业新底座的决心。

　　揆诸现实，在“文心一言”和“通义千问”问世后，国内舆论场反应极为强烈，这背后是国人对于中国科技企业淬炼出硬科技实力的厚重期许。不少人在测试过后，将现有的AI大模型拉来“同框对比”，分析哪个更靠谱。这再正常不过，也确实值得分析。在国外某些大模型已取得先发优势的情况下，有差距也没什么，重要的是正视基础上的追赶。

　　对AI大模型加以对比合情合理，可也得警惕急功近利思维和刻舟求剑目光下的急于否定、盲目拉踩。有人对比先进模型，把尚存差距的“文心一言”说成ChatPPT，对“通义千问”进行嘲讽，这就没必要且不应该了。要知道，通用AI产品的特点就是有着明显的正向增强回路，用户用得越多，越能帮它丰富语料库，继而在迭代中不断完善自己。对国产AI大模型来说，在测试阶段收集更多反馈数据用于大模型迭代和后续研发，这才是关键。对公众而言，在AI技术进步呈现出高度裂变式特征的当下，固然要看这些大模型现在的样子，但更要看它们几个月后的样子——它们的非线性进化速度可能会很惊人。

　　说到底，对于这些AI大模型，我们不能抱着“昨天观”，而应秉持“后天观”。所谓的“后天观”是经济学家梁春晓提出的概念。在他看来，在范式大转型的时代，束缚我们对未来的想象和预测的，是当下一整套工业时代的知识体系、思维方式和基本假设，所以我们不能从今天规划明天，而要从后天规划明天。

　　秉持“后天观”，就得看到AI大模型的长期价值。时下，仍有很多人认为“文心一言”“通义千问”们只是聊天用的，作用无非是对之前AI客服进行升级。这显然是一种认知偏误，低估了AI大模型的长期价值。

　　这次阿里方面就明确表示，推出大模型后将“两条腿走路”：对内改造业务产品，向外做企业专属模型“底座”。而无论是对内接入阿里的各类应用场景，还是对外向企业提供普惠的AI基础设施和大模型能力，对于实体企业获取数字化能力都大有裨益。毕竟，许多中小企业需要的就是低门槛、低成本的数字化工具。

　　当然，要实现这些美好的目标，还需要企业和科研机构通力合作，持久耕耘，在关键领域实现突破。科技发展可能带来的伦理冲突、隐私保护、知识产权保护等问题，亦须各界理性考量、提前防范、早立规矩，确保“科技向善”。当前，社会各方不妨为企业的创新提供包容的舆论氛围，切忌用短视性思维轻易否定或简单抹杀AI大模型的潜力与原力。

浙江日报 数字报纸

文章导航

对AI大模型，可以对比无需拉踩

佘宗明

浙江日报数字报纸