浙江日报 数字报纸


00016版:人文·好奇

美联社宣布本月起开始使用写稿软件

码字机器人来了

  本报记者 李月红 通讯员 林雅琪

  撰写新闻稿已经不再是人的专属权利了。7月初,美联社宣布,将从本月起开始利用美国自动化洞察力公司的写稿软件,自动撰写长度介于150字至300字美国公司收益稿件。借助这款软件,美联社每个季度产出的财报新闻数量将从300条上升到4400条。除此之外Yahoo、体育机构NFL也在使用机器人撰写简单的新闻。看吧,机器人开始挑战纸媒记者了!

  机器人写了条短消息

  美联社并不是第一个吃螃蟹的人。机器人介入新闻生产早已有迹可循。

  今年3月17日,美国洛杉矶附近发生了里氏4.4级地震。《洛杉矶时报》在地震发生半小时后,通过网站发布了全世界第一条地震简讯。

  这条100字的短消息,是由一个名为Quakebot的机器人创作的。从创作到发布,前后只用了3分钟。

  《Long Good Read》是一份由英国《卫报》和报纸俱乐部联手打造的新媒体报纸。在它的生产过程中,机器人成了当之无愧的主角。

  编辑只需处理链接、文字和图像,然后安心撒手,把剩下的一切都交给一个ARTHR半自动页面处理程序工具。它会负责自动排版。

  机器人甚至能提供报纸的私人定制。

  “报纸俱乐部”是一家致力于DIY印刷出版物的公司。它的设想是,让任何人都能策划、设计自己的报纸。该俱乐部为许多人制作过婚礼纪念册式的报纸,还为博主们制作过以博客内容为主的精美印刷品。

  从整理数据到稿件创作,从版面设计再到报纸私人定制,这一批机器人先锋队慢慢深入媒体这个大后方。

  那么,机器人到底是如何实现“写稿”的呢?

  机器人是

  如何写稿的

  “机器人写作,本质上是信息技术创造信息的过程。”宏博知微CEO、中科院研究人员于霄告诉本报记者,他曾负责国内早期最大的工业大数据平台研发。知微则是国内较早的一家专注于社交媒体大数据领域的社会网络数据挖掘联合实验室,与多家门户网站合作,负责提供社会突发事件的舆情分析。

  这里的“信息技术”指的是“算法”。机器人写作的过程就像是进行函数运算,只要把数据输入到函数公式中,就可以得出结果。

  而“算法”就是那个公式。

  在机器人写作中,编程者需要先设计一个算法模型,然后将搜集到的原始数据输入,最后,机器根据算法自动生成一篇稿件。

  一篇数据新闻的生产流程是这样的:设计一个算法模型,利用算法快速搜集网络上与事件相关的信息,把信息汇总到知识库中,提炼知识库中有价值的信息,根据挑选出来的信息自动形成一篇数据报道。最后的这篇报道将呈现事件的来龙去脉和多元的大众观点。

  对于一篇视角普通的数据新闻来说,从数据搜索到最终生成只需几小时甚至几分钟。在这整个过程中,只需用到 1位员工。

  “可以这么说,报道的95%都是由算法操作完成,剩下的5%指的是检验、查错,确保品质,这得靠人工。”于霄介绍道,“你也完全可以把它叫做纯自动化生产。如果不考虑质量,0个人都是可以的,只要有人操作计算接口的启动按钮。”

  机器人让写作变简单

  算法的存在让机器人写作变得简单而迅捷。

  你要做的只是把数据“套”进去,然后坐等成品产出。甚至还没等你完成“坐”这个动作,一篇稿子就出炉了。

  机器人写作的这种快速、大量地处理数据的核心优势,是像“模子”一样的算法所赋予的。但模子也意味着标准化生产。

  算法模型的固定性注定机器人写作与“生动”无缘。

  “机器人写作适用于具有固定模式,劳动特征有重复性的新闻报道,比如说财务报告。”于霄这样认为。

  事实也确实如此。到目前为止,机器人写作主要用于金融、体育这些比较“机械化”的新闻报道。

  算法不是万能钥匙。一种算法无法打开所有新闻的大门。

  不同类别的新闻要设计不同的算法。金融新闻有一套算法模型,体育新闻则有另外一套,无法通用。

  搭建算法模型的时间要根据它的复杂程度而定。“简单的模型可能只需几分钟,复杂的可能需要几年,甚至更长。”于霄说。

  算法的搭建当然离不开硬件。搭建一个算法模型所需的硬件设备视乎数据量的大小、对时效性的要求而定,“时效性要求不高,且要处理的数据量不大的,可能三台机器就能完成,不然几万台都是需要的。”

  机器人写作路还很长

  机器人写手来了,会导致记者失业吗?

  身为“技术乐观派”的于霄认为,这在非常遥远的未来有可能会发生,但是当前绝无可能,“机器人写作会对简单的、重复性的新闻写作造成冲击,但是创作型文字记者完全没有必要担心。因为机器人写作擅长的是结构化数据的处理,在非结构化数据方面,比如语言、语义上的处理能力还是很弱的。”

  浙江大学新闻传媒与社会发展研究所副所长沈爱国与于霄见解一致。他也认为,在相当长一段时间内,机器人写作是不可能取代记者的。

  “机器是冷冰冰的,但新闻是有温度的。人与机器的最大区别在于人有主观能动性,有自主意识,有情感,有价值判断。虽然机器的智能化程度越来越高,但是它无法对肉眼所见的生动场景、对采访对象的情绪进行把握。”沈教授表示。

  “机器人写作还有很长的路要走”,这几乎是一种共识。但是,这条路该怎么走,至今还没有明确的技术方向。

  唯一能肯定的是,面对机器人写手,记者需要有所转变。

  “记者应当回归‘到现场’的本位,花更多的时间深入现场进行采访,捕捉现场生动的细节。”沈教授建议,“记者还应该把更多的精力放在报道深度的挖掘上。因为对错综复杂事件的深度分析,尤其是前因后果的把握、观点碰撞的解析,是电脑模板无法完成的。”


浙江日报 人文·好奇 00016 码字机器人来了 2014-07-14 3544822 2 2014年07月14日 星期一