浙江日报 数字报纸


00005版:要闻

百度“文心一言”上线

本报记者实地探访百度AI研发进展

  本报讯 (记者 蒋梦桦 金春华) 3月16日,备受瞩目的百度“文心一言”上线,“中国式ChatGPT”对外发出第一声,以大家熟悉的“聊天对话框”形式,开始与公众互动。“用‘洛阳纸贵’四个字写一首藏头诗。”百度创始人、董事长兼首席执行官李彦宏在现场出了一道题,马上得到“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央”。有网友评价,这么刁钻的问题体现了百度在中文处理上的优势。“文心一言”目前并不会向全部用户开放,而是采用“内测+邀测”形式。

  作为百度新一代大语言模型,生成式AI“文心一言”的诞生被寄予很多希望。有人说,这是中国AI(人工智能)行业落地的“万里长征第一步”;也有人表示,这是ChatGPT引爆全球互联网之后,作为中国知名科技公司的百度回应舆论关切的“荣誉之战”。

  “文心一言”在百度AI战略中扮演了什么角色?百度AI研发进展如何?日前,记者来到北京中关村软件园方舟大厦一探究竟,百度智能云总部就设在这里。

  “作为一个生成式AI产品,‘文心一言’没有统一固定的‘外貌’,可在多种场景应用中出现。”百度智能云的工作人员李武把记者带到公司的人工智能展厅。“‘文心一言’基于百度自研的知识增强大语言模型,能直接与人对话互动、回答问题、协助创作。”李武边走边介绍,比如现在网络上很火的百度AI数字人,看上去是一个个外表靓丽的“小哥哥”“小姐姐”在播报新闻或跟人对话,背后其实是将人的语音转换成文字后交系统模型处理,模型生成答案后再转换成语音信号输出。这个处理模型,就用了“文心一言”背后大模型的技术。

  “文心一言”是怎么运作的?李武建议先了解一下百度的AI架构。看着大屏幕上一张简单明了的架构图,记者发现,“文心一言”在百度AI体系中其实只是上层诸多智能应用中的一个。

  “百度是目前国内唯一在AI领域全栈布局的公司。”李武言语之间带着自豪。百度AI全栈技术包含芯片层、框架层、模型层和应用层四层,从结构图上看,就像一幢四层楼的大厦。

  第一层是基础的芯片层。百度在2018年推出“昆仑芯”AI芯片,并于2020年量产,据悉是国内首款自研云端全功能AI芯片。这是一款专用芯片,与AI三要素数据、算法、算力密切相关。李武打了个比方,就像人脑处理图像多用右脑、处理文字多用左脑,AI处理不同的场景、模型也需设计不同的芯片。

  第二层是框架层,学名“飞桨”。李武介绍,它相当于AI的操作系统,具有知识生产、数据标注、模型开发等功能,“文心一言”等的开发就基于它。

  第三层是模型层。业内相对熟悉的文心大模型就在其中。擅长处理自然语言的“文心一言”、智能作画的“文心一格”等,都是基于它打造。

  记者现场体验了一把“文心一格”的AI绘画创作。输入关键词“在杭州的春天看潮新闻客户端”,选择“原画风”,再选择“科幻风格”,不到1分钟,屏幕上就出现了带“后现代+赛博朋克”风的图画。

  第四层也就是建立在模型层之上的应用层。运用到AI数字人,就有了中国日报数字员工元曦、央视网数字主持人小C、文博虚拟宣推官文夭夭等虚拟人;运用到制造业,它可能就是一个质检高手。

  有圈内人指出,在人工智能研发领域,中国在全球基本上处于前三的位置。目前,在中文语料搜集、分析,在针对相关AI模型的训练和优化方面,百度还是具有一定优势的。


浙江日报 要闻 00005 百度“文心一言”上线 2023-03-17 25534019 2 2023年03月17日 星期五