每日热点机器人新闻的前世今生

时间: 2023-12-27 12:49:20 |   作者: 开云网络入口

  2017年8月8日21时19分,四川九寨沟发生7.0级地震。中国地震台网16分钟后发布了一条机器人写的新闻消息。这则540字的新闻仅用时25秒。从横向记录镇区经纬度、地形、周边地区,到纵向记载历史上地震灾情,内容准确无误同时配有地震参数图及地形图。当记者和编辑还在不知所措时,机器人已经推送出第一手的稿件。重大灾难事件面前,时效性毫无疑问是最重要的新闻价值。机器人凸显了巨大的优势。

  哥伦比亚大学新闻学院数据新闻研究中心Tow Center于2016年年初发布的研究报告《自动生成新闻指南》(Guide to Automated Journalism)对新闻机器人做了如下定义:

  从上文能够准确的看出“机器人新闻”被认为是模糊和误导性的叫法。准确的概念为“自动化新闻”(Automated Journalism)或“算法”(Algorithms)

  继2014年7月引进“机器人同事”后,《》、《》、《洛杉矶时报》、《卫报》、路透社等媒体都纷纷引入自动生成新闻技术。2015年9月,腾讯也宣布采用自动化新闻“梦幻写手”(Dreamwriter)自动生成财经新闻,发布了中国首篇由算法自动生成的新闻报道《8月CPI同比上涨2% 创12个月新高》。

  编者按:近两年来,国内外新闻业界和学界都在热议 “机器人新闻”(Robot journalism)、“自动化新闻”(automated journalism)、“算法新闻”(algorithmic journalism)、“计算机生成内容”(computer-generated content,CGC)。据预测,“机器人生成内容”(CGC)很快将与“专业新闻记者生成内容”(PGC)以及“用户生成内容”(UGC)一起构成数字化新闻和信息的三大主体。

  所谓“新闻机器人”,其实就是一套软件或算法语言(algorithm),它自动采集数据,然后撰写成人类可读的内容。“算法”指包含一系列很复杂的数学规则、能通过预先设定的步骤解决特定问题的计算机程序。

  机器人(算法)是如何生产新闻的?哥伦比亚大学新闻学院Tow 数字新闻中心曾以“叙事科学”公司的机器人(算法)新闻为例,对其进行“解剖”。这个流程最重要的包含个5步骤:1.读入大量结构化和标准化数据;2.测量数据中的“新闻性”;3.找出合适的报道角度,如果有多个角度,则按照重要性排序;4.将报道角度与数据中的具体事实(story points)相匹配;5.生成报道文本。

  从前述机器人(算法)的内在逻辑能够准确的看出,算法主要是对复杂的新闻写作过程的简化和提炼,是一种“以简御繁”的化约主义(reductionism),也就存在着“挂一漏万”的不足。算法是否能应对以及怎么样应对新闻报道中的复杂性,这对算法的编写仍是一个巨大的挑战。机器人新闻目前主要仍是基于少数几种有限的模板,风格和语调较为生硬。

  将算法应用于新闻和信息的自动采集和发布,其初衷是为了节约人力,提高效率,避免因人的干涉而引入新的错误。但是,算法的自动采集和发布过程一旦被启动,如果源头数据存在瑕疵,加上人力无从及时干预和修正,则会带来广泛的负面后果。

  数字媒介的硬件和软件(图形用户界面)都具有隐蔽性。在软件的遮蔽下,用户看不到自己受到了硬件的限制;而软件本身能使用户与计算机交流,同时却让用户一点都不知道背后的详细过程,还给人以一种开放的印象。机器人新闻基于算法(软件),其运行如“黑箱”,具有隐蔽性,因此新闻机构有责任提高其透明性,以增强公众对机器人新闻生产的全部过程的监督。在这一点上,人类新闻生产中已经存在的增加透明性的种种措施值得传承、借鉴。

  在我国,机器人新闻面临的最大挑战是社会数据化数量和质量水平不高。例如,受制于行业部门条块分割管理体制,各信息领域(如医疗保健、教育和文化艺术等)之间以及各信息领域内部割据,“信息孤岛化”现象很严重,数据不能共享,不能产生整体效益,也导致重复建设,利用率低下。

  众所周知,传统新闻业的商业模式正在失效。新闻媒体为节省成本开始大幅裁员,但新闻生产是劳动密集型产业,裁员必然造成新闻总量的一下子就下降,使得新闻业陷入一种恶性循环,让报业危机雪上加霜。而机器人成为报业逃出这一恶性循环的难得机会。

  我们一般认为是科技发展刺激了传播业,但是传播业对科技也有着刺激作用。例如,弗雷德里克·柯尼格(Frederick Koenig)发明的蒸汽驱动滚筒印刷机是由《》约翰·沃尔特赞助发明的,并于1814年在该报率先使用;世界第一台双筒印刷机“何氏”(Hoe Type)滚筒印刷机也是在1847年被《费城公共记事报》首次采用。报业对技术的赞助和购买使用对技术的发明、传播和改进起到了及其重要的作用。有了这些技术,报纸的发行量才得以大幅度的增加,售价一下子就下降。因此“能够说是便士报将蒸汽印刷机引入了美国报业,而不是因为有了蒸汽印刷机才有了便士报”。

  尽管现在的报业早已不如19世纪上半叶时那样财大气粗,可以投入大量资金推动高速印刷技术的改进,但今天美国报业和机器人新闻技术之间仍存在类似的互动关系,能够说是传统媒体推动了机器人新闻的应用和发展。相对于人类记者常用的“质化”信息采集方式,机器人新闻则完全自动采集、加工和发布,因此具有“快”、“准确”和“廉价”的特点。如在,相同的时间内,人类记者只能产出300条新闻,而机器人记者能产出4400条新闻。(18)2013年,使用“自动洞见”公司的算法自动生成了3亿条新闻,是世界上所有新闻媒体所产新闻的总和,2014年数量则达到10亿条。(19)算法新闻的“快速”和“准确”使它在突发新闻报道上优势显著。如2014年3月,《洛杉矶时报》以极快的速度报道了发生在加州的地震。该报道基于特定算法,从获取有关数据到成文发布仅仅用了3分钟,使得该报成为首发该消息的媒体。(20)

  这意味着,海量和多样的新闻将被以低廉的成本产出——新闻工业化生产时代到来。由于生产所带来的成本极低,此前某些靠人力没办法实现,或者因成本巨大而不切实际的新闻信息领域将会得到开发利用,例如无论哪个名不见经传的体育队或小股票,读者都能读到实时生成的报道,这种按照每个用户需求即时生成的新闻速生速死,阅后即焚。

  让-弗朗索瓦·利奥塔(Jean-Francois Lyotard)对“信息”和“知识”做了区分。他认为,信息与传统形式的知识完全不同。知识要求人类的创造、反思和冥想;信息则是表现性和实用性的,它是以计算机为基础的资本主义(这种资本主义将对数据传输的速度和效率放置在第一位)的货币。利奥塔认为,信息是为了加速资本主义市场而创造出来的“知识”:它的生产很廉价,易于交换,快速消费并被抛弃。(21)按照利奥塔的说法,机器人(算法)的引入使得(财经、体育和突发)新闻生产更加工业化,整体上新闻的“知识性”被削弱,“信息性”大幅增强。但更准确地说,机器人在新闻业中引起的变革是:它使得某些原本是“信息类”新闻的生产变得更加高效和准确,因而使得那些原本更具“知识性”特征的新闻获得更多注意,得到更精细的加工,因而变得更加优质。

  2010年9月,美国《哥伦比亚新闻评论》杂志的封面是一只在轮子上拼命踩着轮子的仓鼠。新闻从业者迪恩·斯达克曼(Dean Starkman)在该期封面文章中指出:记者现在的生存状态如仓鼠,需要生产更多的稿件,这必然导致新闻质量下降。斯达克曼举例道:美国俄勒冈州波特兰市的《俄勒冈人报》(一家久负盛名,多次获得普利策奖的报纸)提出了创建“一流新闻与数字导向的企业”的口号,要求记者在2014年上半年要实现报纸网站发帖总数增加25%,下半年要实现增加40%;每个季度都要有两个重点项目;在“页面浏览量”和“读者参与”两个指标上也提出了更高目标。工作更多,资源更少、报酬更少,斯达克曼将记者比作累死累活的“仓鼠”,而迈克·舒德森则将他们比作亲人尽丧,孑然于世,同时也担心自己随时会离开这样一个世界的鳏寡孤独者。

  记者所面临的以上困境突如其来。与从福特时代就开始的慢慢的变多被机器取代的产业工人不同,新闻记者作为“知识工人”曾一度高枕无忧。但近年来机器人技术的发展,记者被列为9大即将被机器人取代的职业人士之一。

  以上信息似乎说明记者和机器人不共戴天。但实际上,机器人记者却受到了人类记者编辑的欢迎。首先,如前所述,由于有了机器人辅助,新闻机构可以用同样数量的人类记者生产出更多的新闻;其次,机器人记者能将人类记者从枯燥的数字采集和分析工作中解放出来,使后者能去从事更有创造力的内容生产。(25)也强调指出,引入机器人并非是为了取代人类记者:“目的是为使用技术来降低新闻记者编辑的劳动强度,让他们有精力少处理些数据,多做些好新闻。而且在引入机器人的过程中,大多数的记者编辑都持支持态度,并参与了全部讨论。”(26)

  20世纪初,弗雷德里克·泰勒提出“泰勒主义”认为,对于流水线工厂而言,效率是最高原则,因此有必要对工人操作的每个动作进行科学研究,以确保他们都用标准的方法作业,每秒钟都追求最大的效率。在泰勒看来,在工作中,是人要适应机器,而不是机器适应人。泰勒曾经说:“以前,人是第一位的,以后,体系(system)才是第一位的。”他还说,“思考是我的事情;工人们不用思考”。后来美国记者玛姬·杰克逊(Maggie Jackson)将该理论运用于数字传播,提出了“数字泰勒主义”的概念,我们唯有“多任务执行”(multitasking)才能应对数字信息大爆炸。换句话说,在数字时代,做“仓鼠”是新闻从业者的宿命。如果工业时代的泰勒主义是要求人的肌肉适应机器,信息时代的数字泰勒主义就是要求人的大脑也适应机器。“数字泰勒主义的唯一的标靶不再是我们的身体,而是我们的大脑。”

  但是我们大家都认为,只要人类处理得当,将机器人(算法)引入新闻生产并不必然会带来“数字泰勒主义”,让记者的“仓鼠”境遇更加恶化,而是相反,它可能扭转这一局势。对于人类而言,现在以及未来的新闻工作将会更加技术化,会充满着算法、程序和模板;同时也会更加人性化,那些能够与机器合作,同时又具有讲述好故事的能力、人文关怀和幽默情感的记者将是新闻市场中的稀缺资源。

  未来的新闻报道,其基本事实的采集将由机器完成,而判断、分析、解释、预测、叙事、伦理、润色等则需要由人类完成。(27)在新闻生产中,新闻记者并不是直接和机器人竞争,而是在与机器人合作的过程中,如何充分体现人性。这种通过人机合作完成的将是一种复合型新闻产品,它在事实上如机器般精确无误,在可读性上令人回味无穷。

  人工智能研究的先驱、数学家马文·明斯基(Marvin Minsky)认为,人类要尊敬自己制造的机器人;不该将它们堆放在没有窗户的工厂里,干些没人乐意干的活;不该将它们当奴隶一样使唤。他不遗余力地鼓吹把人脑的智能装入计算机,以“让机器变得像人一样”。而发明了文字处理技术、鼠标和超媒体的神奇小子道格拉斯?英格巴特(Douglas Englebart)却提倡“电脑为人服务”的理念。上世纪五十年代,这两位宗师曾在麻省理工学院相遇,留下一段脍炙人口的对话。明斯基说:“我们人类要给机器赋予智慧,让它们拥有自我意识!”英格巴特回答说:“你要为机器做那么多好事?那你打算为人类做点什么呢?”现在,那些致力于使电脑界面更友好、更人性化、更以人为本的工程师们常常会讲起这一个故事。(28)上海第一财经首席技术专家汤开智就说:“机器能帮我们做简单机械的事情,我们人类就可以腾出精力来做更高级的事情。”他显然是赞同英格巴特的立场的。

  在机器人新闻时代,事实性报道将由机器人记者完成,解读性报道则将由人类记者完成。人类记者在写作新闻稿时,也将会尽量显示出自己是“人”,而不是“机器”,未来仍然是“人有人的用处”(控制论创始人诺伯特·维纳语)。所谓“公正”,并不是所有参与者都得到一样的,而是都得到其最适合的。在未来的人机关系中和新闻业中,最公正的场景应该是“人机共生,各司其职,相得益彰”。


金达雅陶瓷:一线品牌金牌品质