浙江日报 数字报纸


00007版:观点

对AI大模型,可以对比无需拉踩

  继百度发布“文心一言”、360展示“360智脑”后,阿里也正式发布了大模型产品“通义千问”。4月11日,在2023阿里云峰会现场,阿里巴巴有关负责人表示,阿里巴巴所有产品未来将接入“通义千问”,进行全面改造,并称阿里云将把AI基础设施和大模型能力向所有企业开放,共同推动AI产业发展。

  阿里正式推出“通义千问”,意味着通用AI赛道有了更多“中国选手”。考虑到动辄超千亿参数的大模型研发不是个单一的算法问题,而是囊括了底层算力、网络存储、数据清洗与治理、AI框架、人类调优等多个方面的系统性工程,AI技术研发又攸关国家数字主权、未来科技竞争,不少中国科技企业加入AI大模型卡位战中,也是好事一桩。

  可以看到,国内多家企业的AI大模型都在跃跃欲试,这跟国外同样激烈的竞争节奏遥相呼应。一众科技公司在AI上的“军备竞赛”,反映的是抢占AI技术及产业新底座的决心。

  揆诸现实,在“文心一言”和“通义千问”问世后,国内舆论场反应极为强烈,这背后是国人对于中国科技企业淬炼出硬科技实力的厚重期许。不少人在测试过后,将现有的AI大模型拉来“同框对比”,分析哪个更靠谱。这再正常不过,也确实值得分析。在国外某些大模型已取得先发优势的情况下,有差距也没什么,重要的是正视基础上的追赶。

  对AI大模型加以对比合情合理,可也得警惕急功近利思维和刻舟求剑目光下的急于否定、盲目拉踩。有人对比先进模型,把尚存差距的“文心一言”说成ChatPPT,对“通义千问”进行嘲讽,这就没必要且不应该了。要知道,通用AI产品的特点就是有着明显的正向增强回路,用户用得越多,越能帮它丰富语料库,继而在迭代中不断完善自己。对国产AI大模型来说,在测试阶段收集更多反馈数据用于大模型迭代和后续研发,这才是关键。对公众而言,在AI技术进步呈现出高度裂变式特征的当下,固然要看这些大模型现在的样子,但更要看它们几个月后的样子——它们的非线性进化速度可能会很惊人。

  说到底,对于这些AI大模型,我们不能抱着“昨天观”,而应秉持“后天观”。所谓的“后天观”是经济学家梁春晓提出的概念。在他看来,在范式大转型的时代,束缚我们对未来的想象和预测的,是当下一整套工业时代的知识体系、思维方式和基本假设,所以我们不能从今天规划明天,而要从后天规划明天。

  秉持“后天观”,就得看到AI大模型的长期价值。时下,仍有很多人认为“文心一言”“通义千问”们只是聊天用的,作用无非是对之前AI客服进行升级。这显然是一种认知偏误,低估了AI大模型的长期价值。

  这次阿里方面就明确表示,推出大模型后将“两条腿走路”:对内改造业务产品,向外做企业专属模型“底座”。而无论是对内接入阿里的各类应用场景,还是对外向企业提供普惠的AI基础设施和大模型能力,对于实体企业获取数字化能力都大有裨益。毕竟,许多中小企业需要的就是低门槛、低成本的数字化工具。

  当然,要实现这些美好的目标,还需要企业和科研机构通力合作,持久耕耘,在关键领域实现突破。科技发展可能带来的伦理冲突、隐私保护、知识产权保护等问题,亦须各界理性考量、提前防范、早立规矩,确保“科技向善”。当前,社会各方不妨为企业的创新提供包容的舆论氛围,切忌用短视性思维轻易否定或简单抹杀AI大模型的潜力与原力。


浙江日报 观点 00007 对AI大模型,可以对比无需拉踩 2023-04-12 25622228 2 2023年04月12日 星期三