摘 要 新闻业的量化转向已经成为当前新闻业发展的一个突出趋势。学界和业界使用了许多不同的名词指称各种与数据、计算、算法、应用、互动等有关的新闻工作。本文在计算新闻的概念下对现有研究进行了梳理,详细阐述了计算新闻的概念、内涵、意义和实践,最后提出了推进计算新闻研究的三个方向。
关键词 计算新闻;算法;自动化;大数据
中图分类号 G210 文献标识码 A 文章编号 1001-8263(2017)06-0108-10
DOI:10.15937/j.cnki.issn 1001-8263.2017.06.015
作者简介 白红义,上海社会科学院新闻研究所副研究员、博士 上海 200235
一、新闻业的量化转向
当下的新闻业已经进入了一个大数据时代。不同类型的涉及数据使用的新闻实践和产品大量涌现,正在并将继续对当代新闻业产生重要影响,而研究数据及与其相关的算法、电脑代码、编程、自动化等在新闻中的应用正在成为一个快速增长的领域。①作为一个相对较新的名词,大数据是一个相当具有弹性的概念。在严格的计算意义中,大数据是指那些过于庞大而标准的电脑程序无法处理的数据,它不只是一个具体的技术规格,而是围绕大量数据的处理过程。②大数据在新闻业中的出现是技术变迁影响新闻业的又一例证。不同研究者就此使用了不同的词汇来形容这一新的趋势,如“新闻业的计算转向”(computational turn in journalism)③、“新闻业的计算探索”(computational exploration in journalism)④、数据驱动新闻(data-driven journalism)⑤、量化新闻(quantitative journalism)⑥、量化取向的新闻(quantitatively oriented forms of journalism)⑦等。目前来看,计算新闻(computational journalism)正在逐渐成为一个最常用的术语,把上述各种与数据相关的实践活动都囊括在内。
计算新闻的兴起与大数据时代的到来有着密不可分的关系,作为一个学术概念,它在计算社会科学成为当前的学术热点后渐渐为学者们所使用。计算本身不是一个新鲜事物,但计算工具和技巧在各个领域的大量深入使用却是近年来才出现的新情况。不仅在自然科学领域内成为解决科学问题的重要路径,而且在社会科学领域也变得越发热门起来,一个主要的原因就在于大数据和新的计算工具的兴起。⑧随着新的数据收集、数据挖掘和分析支持技术的出现,社会科学研究者能够提出的研究问题和可以应用的研究方法均有根本性的变化,大数据带来了社会科学研究范式的转变。⑨计算社会科学随之成为一个独立学科,在此框架下,不同的分支学科也相继涌现,如计算社会学⑩、新计算社会学[11]、计算社会心理学[12]、计算传播学[13]以及本文着重讨论的计算新闻学[14]。
计算新闻学是对计算新闻所展开的学术研究,先有作为实践的计算新闻,然后才出现了作为学术概念的计算新闻。计算新闻在新闻业中的应用和实践早已有之,现有研究通常将其源头追溯到20世纪60年代的计算机辅助报道(computer-assisted reporting,常缩写为CAR)。[15]时至今日,计算新闻专注于计算的处理能力,特别是对信息进行聚合、自动化和抽象化的能力,早已经超越了CAR体现出的计算水准。[16]计算新闻的实践形态已经表现出更为丰富的样式,其中涉及的计算深度和广度也各有不同,以致有学者称“一个鲜明的计算新闻的时代正在形成”。[17]简单地说,计算新闻就是指计算工具、方法和计算思维在新闻业中的应用,但它不是一种计算方法的简单应用,而是指利用计算软件实现对海量数据的操控,以实现接近、组织和呈现信息的新方式的目的。[18]
计算新闻正在成为新闻研究中的一个新兴增长点,这是在新闻业与新技术的交叉地带出现的新现象和新问题。过去20多年,迅猛发展的新兴技术对新闻业的影响不仅涉及新闻的收集、过滤和分发等最基本的层面,而且影响着新闻机构、商业模式、分发渠道乃至受众的变化。在经典的新闻社会学研究中,技术问题虽然经常被提到,但很少被详细地讨论,并没有获得足够重要的位置。[19]计算新闻代表着一种技术导向的新闻业[20],它的兴起标志着新闻与技术的关系进入了一个新的阶段,技术不再是“连续性的典范”和“需要服从的威胁”,也能够作为“新闻革新的基础”。[21]深刻的现实变化对当前的新闻研究提出了新的要求,但作为一个新兴的学术领域,关于计算新闻的研究仍处在一个起步阶段。本文将在系统审视相关文献的基础上,围绕下列三个问题展开讨论:第一,计算新闻的概念、内涵及意义是什么?第二,哪些实践称得上是计算新闻?第三,当下应该如何研究计算新闻?
二、计算新闻的概念、内涵与意义
尽管计算新闻的形式早已有之,但作为一个学术概念提出的时间不算太长。研究者们开展的一个主要工作就是对这个领域进行更准确地界定,厘清其内涵或本质,并揭示其对于新闻业的意义。在一个早期的定义中,汉密尔顿(Hamilton)和特纳(Turner)把计算新闻定义为“算法、数据和社会科学知识的结合,以补充新闻业的问责功能”,并进一步认为,“计算新闻旨在使记者在搜索新闻线索时探索越来越多的结构化和非结构化信息,同时,它提供了一种新的方式来帮助维系民主社会所需要的‘看门狗’报道”。[22]科丁顿(Coddington)认为这一界定过于宽泛,无法对不同的计算实践予以清晰的区分。因此,他将计算新闻定义为一种技术导向的新闻,其中心在于将计算和计算思维应用于信息收集、感知和信息呈现的新闻实践中,而不是笼统地说是数据或者社会科学方法在新闻中的运用。[23]迪亚克帕罗斯(Diakopoulos)早前曾把计算新闻界定为计算技术和计算思维在新闻业的应用,以促进信息的收集、组织、意义建构、报道和传播等相关新闻工作的展开。[24]此后,他试图跳出这种工具导向的理解,更强调了算法在其中的核心位置,“使用和通过算法寻找和讲述故事以及关于算法的故事”。[25]在斯普伦多雷(Splendore)看来,计算新闻是一个协作过程,它更多地关注生产有形产品或平台而不是叙事,也更依赖于高级编程技能之类的技术专业知识,并将公众视为理性参与用户的集合。[26]卡森(Karlsen)等人则提出了计算新闻是一种修辞技巧的新理解,将其视为取决于特定技艺或是对实践的潜在因果关系有深刻理解的活动。[27]
随着研究的深入,学者们提出了更多理解和认识计算新闻的方式,逐渐缩小了计算新闻的外延。但即使是一个狭义的理解,在计算新闻这把大伞下依然存在着不同类型的计算新闻的实践形式。[28]这一现状导致在涉及数据与新闻业的领域存在着不少相近但又不互相统属的概念,可见计算新闻仍是一个相当分散的研究领域,跨学科的本质似乎又强化了这种分散的特点。[29]无论是何种形式的计算新闻,其核心都是计算思维(computing thinking)。[30]计算思维是指运用计算机科学的基础概念去求解问题、设计系统和理解人类的行为,它的本质是抽象和自动化:抽象能力如抽象算法、模型、语言、协议等,自动化能力如系统、程序、编译等。[31]计算过程则体现着具体的计算思维,泰勒(Taylor)勾勒了计算过程在新闻工作中能够发挥基础性作用的三个领域:自动化、算法和抽象。[32]自动化提升了数据收集和解释、数字处理、网络分析、排序和处理等活动的能力,否则这些工作就要由人工完成;算法允许操作者遵循预定步骤来实现目标、识别问题,在大量替代方案中找到合适的解决方案,并以可靠、一致和有效的方式验证信息;抽象使得不同层次或角度的新观点有可能被呈现,探索新的方向。[33]
计算新闻最终的落脚点还是在于它对新闻业的影响。汉密尔顿和特纳就认为,计算新闻提供了一种新的方式来帮助维持民主社会所需的“看门狗”报道。由于新闻业的传统商业模式崩塌,媒体已经没有足够的动力去从事成本高昂的“看门狗”报道。计算新闻虽然不能改善新闻业的经营状况,但它可以创建能够降低报道成本的新工具,更好地利用新的信息环境,最终帮助履职技术巨变下的“看门狗”工作。[34]还有研究者指出,虽然公众可获得的数据量不断增加,但运用数据为公共利益新闻工作的能力却仅限于少数记者,计算新闻正是弥合这一鸿沟并保护新闻业的“看门狗”传统的关键。[35]记者和计算科学家共同开发新的方式,以降低公共事务深度报道的成本和难度,计算新闻作为一种支持问责报道的新兴工具将会对公共利益产生强有力的潜在影响。[36]丹尼尔(Daniel)和弗卢(Flew)具体罗列了四点好处:通过使用计算工具和技巧,记者能够增加原创调查性报道的深度、与竞争者进行区分、加快新闻从消息来源到发布的过程,以及为分析提供事实依据,从而降低错误报道的风险,抵制来自公关的影响。[37]弗卢等人认为,将计算方法和技术扩展到新闻业的意义在于,计算新闻可以使得信息技术专家和记者共同开发新的计算工具,为原创的调查新闻提供新的基础,并扩大与读者互动的范围。使记者免于从事发现和获得事实的低水平工作,而是更加重视新闻的核查、解释和传播,为公众提供准确、原创、可靠和对社会有用的信息。[38]
很多研究者之所以对计算新闻的社会功能抱有乐观态度,一个很重要的原因可能在于,他们研究的案例多是计算方法和工具在调查性新闻生产中的运用。随着计算新闻实践日渐多元化,计算新闻的价值也应该不止于此,但这种价值并不会因新技术的引入而自然地获得,新闻业的创新涉及个体、组织、网络等不同层面因素的影响。[39]正如安德森(Anderson)所言,如果计算实践是新闻业的救命稻草,那么这根稻草也是一把双刃剑,它取决于许多新闻业之外的社会制度和技术物。[40]
三、计算新闻的实践领域
对于一个新近出现的领域,概念和缘起等理论层面的思考十分重要,但不同研究者之间的争议表明,究竟什么是计算新闻、谁在做计算新闻、哪些称得上是计算新闻等问题,需要更多的经验研究予以解答。就现有研究而言,研究者们集中讨论了数据新闻、程序员新闻和算法新闻三种计算新闻实践。
1.数据新闻
在计算新闻的概念提出前,数据新闻就已经成为一个快速发展的领域。但需要强调的是,并不是所有的数据新闻都与大数据相关,一些所谓的“数据新闻”其实只是在表面上涉及了使用特定类型的数据,仅作为一种“装饰信息”的方式。[41]从开放数据的使用方式来看,判断数据新闻是否是计算新闻框架下的数据新闻,关键标准在于数据的来源是人工获取的还是自动获取的,只有后者才是计算新闻意义上的数据新闻。[42]现有研究可以分为三类:
一是对数据新闻在某个或某些国家及地区发展现状的研究。塔巴里(Tabary)等人对2011至2013年间加拿大魁北克的数据新闻发展状况进行了研究,着重考察数据新闻中的行动者、使用数据的条件、实践及所需的计算和统计技能。[43]博尔赫斯雷伊(Borges-Rey)研究了英国的数据新闻实践中对数据库和算法的应用情况,通过对英国主流媒体中的数据记者、数据编辑和新闻经理进行的半结构化访谈,分析了数据新闻如何在英国专业新闻室运作以及数据新闻为新闻报道、采集和传播带来的创新之处。[44]在另一篇文章中,博尔赫斯雷伊提出了一个“重要性、表现力和反思性”的原创分析模型,作者以此研究了数据新闻在苏格兰、威尔士和北爱尔兰地区的发展及其面临的挑战。尽管上述三地的数据新闻显示出独特性,但都强化了开创这种实践的传统媒体的规范和仪式。[45]迈尔(Maeyer)等人考察了比利时法语区数据新闻的发展,作者把数据新闻视为一种“社会—话语实践”,不仅数据驱动的新闻工具生产在塑造着数据新闻的理念,而且新闻室内外的所有相关行动者的话语实践也在发挥着作用。[46]阿佩伊伦(Appelgren)和尼格伦(Nygren)对瑞典数据新闻发展状况的研究发现,在将新的方式和新闻类型引入“旧”组织的过程中,对数据新闻的态度与数据新闻工作方法中所感知的经验水平相关。当前数据新闻工作方法面临的主要挑战是缺乏时间,需要培训和发展数据新闻技能。[47]芬克(Fink)和安德森(Anderson)强调在理解数据新闻现象时不能仅停留在组织内部,还要跨越组织在机构间层面上审视这种新兴实践。他们发现,美国数据记者在教育背景、技能、工具和目标等方面存在相当大的差异,但是也面临着如何界定他们在组织内的角色和管理稀缺资源等共同的困境。[48]
二是对数据新闻报道作品进行的研究。有研究者对《卫报》的260篇数据新闻报道进行了内容分析,对大数据新闻实践与传统新闻价值、规范和常规进行了比较。研究结果表明,大数据新闻在使用资源方面显示出新的趋势,但仍然普遍遵循传统的新闻价值观和新闻样式。[49]杨(Young)等人的研究对加拿大媒体向三家新闻协会提交的数据项目进行了内容分析,着重探讨记者如何制作堪称卓越的数据新闻。但研究结果表明,并没有一个公认的标准来判断数据新闻是否卓越,其质量受到两个关键因素的限制。[50]阿佩伊伦研究了北欧数据新闻奖中的31个数据新闻项目,借此讨论数据新闻中工程文化与新闻文化杂糅后的混合形式,她称之为“父爱主义”,技术专家对此持否定态度,记者却认为这是新闻业中固有的合理内容。作者发现了数据新闻中父爱主义的三大特征:控制功能、互动性的错觉和线性度。[51]
三是对数据新闻记者展开的研究。博伊尔斯(Boyles)和梅耶尔(Meyer)关心的问题是,数据新闻记者是否承担了传统记者在民主社会所扮演的公众信任守护者的角色。作者对美国顶尖报纸的数据新闻记者的深度访谈发现,他们也秉持着传统的职业模式。在面向公众处理大数据时,数据新闻记者把自己定位成抽象和技术知识的转译者,也在为公共利益服务。[52]阿佩伊伦考察了一个2012年创建于瑞典的Facebook兴趣小组“Datajournalistik”,这是北欧地区数据新闻记者发展数据新闻技能的重要平台。作者以格兰诺维特(Granovetter)“弱关系的力量”为理论基础,对2012至2014年间所有收到过评论的帖子进行了内容分析,用以探讨小组的社会功能。结果表明,北欧的数据新闻记者对知识交流具有强烈需求,对自我肯定也有需求。[53]
2.程序员新闻
严格说来,程序员新闻可以归入数据新闻中对数据记者的研究。只不过与前述研究相比,更侧重于讨论各类技术人员在新闻室中的角色、认同和作用,此类人员的出现是新闻业加强与计算机编程技术合作趋势的一种体现。不同学者对此使用了不同的称谓,如程序员记者、黑客记者等。这一领域内较早的经验研究是罗亚尔(Royal)对《纽约时报》互动新闻技术部门的研究,作者发现受访的技术人员把他们的工作视为具有强烈编辑色彩的新闻工作,热爱和欣赏新闻业的价值观。[54]帕罗西(Parasie)和达吉拉尔(Dagiral)的研究讨论了把程序员引入新闻室从事数据驱动的新闻计划所产生的影响,程序员的引入挑战了美国计算机辅助报道传统所体现的认识论:CAR的基础是假设数据可以帮助记者通过披露公共问题来制定政治议程,而程序员则扎根于黑客文化。[55]帕罗西进一步讨论了调查性新闻引入大数据后引发的认识论的冲突。作者以位于美国旧金山的调查报道中心(CIR)进行的一个为期19个月的调查过程为例,其中的调查记者、计算机辅助报道记者、程序员记者具有各自不同的认识论背景,但由于同一物质性人工产品的存在反而降低了潜在的冲突,强化了组织内的合作,克服了认识论上的冲突。[56]
总的来看,早期针对记者与程序员在新闻室中的工作状况进行的研究主要集中在对美国媒体的研究,之后又陆续出现了对其他国家的实证研究。韦伯(Weber)和拉尔(Rall)研究讨论的是不同于美国模式的欧洲模式。在德国和瑞士,记者和程序员的不同角色有着清晰的界定:记者负责新闻产品的研究和内容,程序员和工程师则负责其中的视觉或互动成分。而《纽约时报》的成功就在于程序员和设计师都属于新闻小组,每个组员都像记者一样思考和行事,这种创新性的态度是《纽约时报》成功的关键。[57]卡森(Karlsen)和斯塔韦林(Stavelin)对挪威新闻室的研究发现,从事计算新闻的受访者都在新闻室而非技术部门工作,记者和工程师的相互依赖似乎强于他们在工作文化上的差异。这些计算记者认为,从事计算新闻的前提就要像记者一样行事,他们把新闻传统放在比技术更为重要的位置。[58]但在对英国BBC和FT的研究中,汉纳福德(Hannaford)发现,受访者并不认可此前研究中发现的混杂角色。记者和工程师是两种截然不同的专业,记者没有学习如何写代码,工程师也坚决否认自己是记者。作者发现了一个记者、程序员和设计师在数据驱动项目中紧密合作的新模式,与美国新闻室的情况形成了显著差异。[59]
上述研究主要是在新闻室语境下讨论技术人员介入新闻生产后带来的新问题,刘易斯(Lewis)和厄舍(Usher)的研究则更多考察了新闻室外的案例,探讨新闻世界和技术世界如何在新闻创新的共同目标下携手合作。他们研究的第一个案例是一个叫“黑客和黑客”(Hacks/Hackers)的跨国草根组织,该组织的成员对于通过开源软件编程为新闻寻找技术解决方案方面拥有共同兴趣。作者确定了四种与新闻业既有关联也有偏移的开源文化:透明性、修补、迭代和参与,开源给技术人员和记者们提供了机会一起去思考传统新闻学拥护的新价值。[60]在对这一组织的后续研究中,两位作者试图了解记者和技术专家如何通过这个组织进行交流:什么样的互动将会发生?哪些因素可能促进协作?作者认为,黑客/黑客组织成了一个非正式和短暂的“交易区”,记者和技术人员可以随时会面和协调。两类人员的参与程度取决于一系列社会和结构性因素,包括机构支持、关键志愿者的领导等,参与的深度则取决于记者和技术人员之间充分的相互了解。[61]刘易斯和厄舍研究的第二个案例是Knight-Mozilla创建的一个在线“学习实验室”。在实验室里60位由记者和程序员构成的学员通过开源软件协调新闻创新的共同兴趣。借鉴科学技术研究中的交易区和边界客体概念,作者探讨了关于新闻和技术的不同理解如何融合、分化并最终混合在一起,朝向制作更具过程取向的、参与式的、社会策划的新闻。由于程序员及其伦理将在新闻领域发挥更大的作用,通过边界协商这一窗口可以透视新闻及其规范和价值的未来发展。[62]
3.算法新闻
如果说数据新闻是已经形成的热点,那么算法新闻正在受到越来越多的关注,正在成为新闻生产的又一个热门趋势。与大数据最直接相关的新闻就是自动化新闻、算法新闻或机器人新闻。[63]安德森也强调了计算新闻的算法维度,“算法在调节记者、受众、新闻室和媒体产品等方面发挥着越来越重要的社会技术作用,这种调节兼具社会性和规范性的意义”。[64]在新闻生产中,对算法和数据的新闻使用已经从数据分析和新闻选择迈向了一个更为先进的自动化状态,在不需人工介入的情况下程序就能够将数据转换为可发表的新闻报道。在卡尔森(Carlson)看来,在目前出现的以数据为中心的新闻实践中,没有一个像自动化新闻这样具有潜在的破坏性,机器写作新闻的能力提高所开创的新领域之广已经远远超过了人类记者的生产能力。[65]不过,他并不认为人类记者会被机器取代,未来的新闻将会是一个机器写作与人类写作并存的状态。[66]
学者们已经使用了诸多不同的概念来描述这一现象,如机器人新闻、自动化新闻、算法新闻、机器写作新闻等,这些名词在一定程度上可以互换。算法或自动化技术给新闻生产带来了许多便利,如算法能够更快地大规模生产新闻,并且可能比人类记者犯更少的错误;算法还可用相同的数据以多种语言和不同角度来进行报道,从而为不同读者的偏好提供个性化满足;算法也能回应用户对数据的需求来订制新闻。但在带来巨大便利的同时,算法新闻的发展也激起了新闻界对自动化内容终将消除新闻室工作的隐忧。[67]算法只是在近几年才成为新闻组织为其网站生产新闻的可用工具,在新闻室语境下进行的经验研究依然有限。卡尔森把现有研究简单地分成两类:一类聚焦于自动化新闻的质量,一类关心自动化新闻如何影响新闻生产。[68]
在前一类研究里,克莱瓦尔(Clerwall)的研究旨在探讨读者如何看待软件生产的内容以及由记者撰写的类似内容。该研究利用实验方法调查受访者如何感受由记者撰写的不同新闻或软件产生的新闻,被访者被要求从文章的整理质量、可信度、客观性等角度评估他们所看到的新闻。结果表明,软件生成的内容被读者认为是描述性和无聊的,它也被认为是客观的,尽管并不一定能够与记者撰写的内容区别开来。[69]钟(Jung)等人研究的是韩国公众和记者如何看待算法新闻的质量。结果显示,当算法新闻被告知是由真正的作者所为时,公众给予算法作品的得分很高,但当被告知作者为记者时,得到的公众评分就降低了。受访记者表现出了与公众同样的行为模式,对计算作品给出了高分,却对记者作品打了低分。[70]记者和受众对自动化新闻的质量评估影响着新闻组织是否决定采用这种新技术。一个来自韩国的研究就发现,引进机器人新闻带来的商业前景和新闻消费者阅读机器人新闻的意愿是报业公司决定是否引入机器人新闻的主要因素。[71]瑟曼(Thurman)等人的研究指出,尽管记者们认为自动化新闻在消息来源和新闻敏感方面存在不足,但他们依然认为,自动化新闻将会变得越发普遍,并逐步增加报道的深度、厚度、特异性和即时性。[72]
在第二类研究里,范·达伦(Van Dalen)分析了记者对机器写作新闻的反应,探究这一新技术如何促使记者重新审视自己的技能。作者发现,记者往往通过履行的任务来界定他们的专业,而不是通过拥有技巧和知识实现任务的人。在与自动化新闻对比时,记者们强调分析能力、个性、创造力和写作复杂句子的能力是定义新闻的重要技能,而不是真实性、客观性、简洁和速度。记者甚至将“机器人新闻”视为一种机遇,当常规任务可以自动完成时,记者将有更多的时间从事深度报道。[73]拉塔尔(Latar)把自动化新闻与人工智能的进步联系起来,由于人工智能所具有的局限性,必须告知读者报道是由机器人还是人类记者所写。机器人记者不会成为民主和人权的守护者,只有人类记者才能担此重任,依赖自身优势才能与自动化新闻进行竞争。[74]卡尔森以“叙事科学”为研究对象,揭示自动化新闻对于新闻劳动的未来、新闻组成形式的一致性和新闻权威的规范性基础三方面产生的影响,意在讨论自动化新闻如何改变记者的工作实践,以及如何影响了对于什么是新闻、新闻应该如何运作的理解。[75]布赫(Bucher)研究了算法新闻中的三个关键过程自动化、个性化与策展如何影响新闻业,不仅专业界定、规范和理想要适应算法的影响,而且算法也要能与编辑实践和新闻价值有所交汇。[76]这些研究都着眼于记者对自动化新闻的理解,它不仅是一种研究路径的选择,还具有实际效用。林登(Linden)的研究就指出,在几十年的新闻室自动化过程中,记者已经表现出强烈的适应新技术的能力,为自己的工作赋予意义可能有助于缓解自动化新闻趋势所带来的压力。[77]
四、从计算新闻到计算新闻学
作为一个新兴的新闻实践现象,计算新闻的出现已经引发了新闻研究者的极大热情,出现了大量以数据、算法、计算等为主题的英文论文。刘易斯把现有研究归纳为三种路径:其一,对新闻组织内部和跨组织间的新闻记者的案例研究;其二,在新闻学的框架下对计算机科学、编程等概念进行理论思考;其三,采用一种历史视角对当前的发展与电脑辅助报道进行比较分析。[78]这些研究对于理解当前的计算新闻无疑有很大的帮助,但与丰富的计算新闻实践相比,在此基础上形成的计算新闻学研究依然有很大的提升空间。一方面,研究者提出了很多概念,有时不同概念指称的对象是相同或相近的,但有时同一个概念在不同的研究者那里指代的却是不同的研究对象,给相关研究之间的对话造成了一些难度;另一方面,针对具体的计算新闻实践的实证研究依然有限,而且既有的实证研究也往往集中在对美国新闻业案例的探讨,导致研究结论有一定的局限性。这一现实表明,计算新闻从一个实践领域进入学术领域还有很大的提升空间,需要在概念界定、研究对象、研究问题和研究方法等方面有所创新和进步。本文认为,可从下列三个方面着手,继续推动计算新闻学的发展。
第一,深化对计算新闻的理解。由于历史和现实中存在着纷繁复杂的计算新闻现象,通过比较研究来揭示计算新闻的内涵和本质是一条切实可行的路径。不仅是与过往的历史比较,如计算机辅助报道、精确新闻等;还要与当下并存的现实比较,如数据新闻、算法新闻等。此前科丁顿对计算机辅助报道、数据新闻和计算新闻的比较[79],斯普伦多雷对数据新闻、计算新闻和算法新闻的比较[80],对于理解不同类型的计算新闻实践的共性与差异很有帮助。今后还应加强在概念、理论和历史层面的研究,在命名、分类等方面做得更为细致和贴切。
第二,拓展计算新闻的研究路径。计算新闻是新闻研究对象的一次重要拓展,代表着新闻研究中的物质转向[81],对它的研究必然会带来新闻研究范式和路径的更新。一个突出的例子就是科学和技术研究中的理论和方法被大量引入新闻研究中来,如刘易斯和厄舍对交易区和边界客体[82]、卡尔森对技术戏剧的使用等[83]。在研究路径上,安德森呼吁要迈向一个计算和算法新闻社会学的研究体系,为此总结了“政治、经济、场域、组织、文化和技术”六种研究路径。[84]刘易斯也提出从案例、概念和批判三种路径对大数据时代的新闻展开研究。[85]有些路径已经被广泛采用,有些路径则还是未开垦的处女地。
第三,扩大计算新闻的研究对象。现有的实证研究主要集中在对美国、英国以及少数北欧国家的分析上,不仅覆盖的国家和地区较少,而且多聚焦于《纽约时报》等精英媒体。在此基础上形成的分析结论只能反映一些领先国家和媒体的发展状况,对计算新闻在其他国家和媒体的发展现状、影响因素、动力机制等问题知之甚少。此外,现有研究基本是在新闻室语境下进行的,关注的是传统媒体和新兴媒体在计算新闻方面的实践。然而,Facebook、Twitter等技术创业公司凭借其在平台、算法和数据等方面的优势,正在成为新闻场域中异常重要的角色。[86]他们不仅“决定”受众看什么、谁为这些内容付费、规范了新闻产品的样式,而且“强制”传统新闻机构重新思考新闻演化进程和组织结构。[87]研究者已经关注了这些机构如何使用计算工具和方法分发新闻内容[88]、新闻业又如何看待这些场域中的新来者[89]等问题,但是他们的计算新闻实践如何影响新闻生态、新闻组织如何应对等问题依然值得认真审视。
五、结语
本文讨论的是一个在大数据背景下日渐勃兴的领域,数据新闻、算法新闻、数据驱动报道、计算新闻、数据库新闻、计算机辅助报道、数据驱动新闻、量化新闻等不同名词纷纷触及了其中的某一个侧面。概念的复杂有时并不代表着实践也是如此多元,看似多样化的概念有时描述的却是相近的现象。如果说在一个新兴研究领域出现初期,缺乏有共识的定义还情有可原,那么现在就需要一个更具统摄性的概念来把既有研究纳入一个可以比较、归纳、分析和阐释的体系。计算新闻在众多相近概念中脱颖而出,虽然像任何一个新概念一样,对它的界定仍处在争议之中。作为一个新领域,它既有令人高度期待的一面,也有极不易确定的边界。[90]从本质上来说,计算新闻是在新闻业与新技术的交叉地带出现的新现象和新问题。以往的新闻社会学理论对于技术问题着墨甚少,既不能提供框架,也不提供术语或经验证据,以表明技术是新闻生产的一部分。[91]计算新闻作为新闻业中的新客体(new objects)[92],或许有望成为拓展新闻研究疆域的一股驱动力。
注:
①Lewis, S.C. (2015). Journalism in an Era of Big Data. Digital Journalism, 3(3), 321-330.
②Lewis, S. C., & Westlund, O. (2015). Big data and journalism: Epistemology, expertise, economics, and ethics. Digital Journalism,3(3), 447-466.
③Bucher, T. (2016). ‘Machines don’t have instincts’: Articulating the computational in journalism. New Media and Society.
④Gynnild, A. (2014). Journalism Innovation Leads to Innovation Journalism: The Impact of Computational Exploration on Changing Mindsets. Journalism, 15 (6), 713-730.
⑤Coddington, M. (2015). Clarifying journalism’s quantitative turn: A typology for evaluating data journalism, computational journalism, and computer-assisted reporting. Digital Journalism, 3(3), 331-348.
⑥Anderson, C. W. (2015). Between the unique and the pattern: Historical tensions in our understanding of quantitative journalism. Digital Journalism,3(3), 349-363.
⑦Splendore, S. (2016). Quantitatively oriented forms of journalism and their epistemology. Sociology Compass, 10(5), 343-352.
⑧Bucher, T. (2016). ‘Machines don’t have instincts’: Articulating the computational in journalism. New Media and Society.
⑨Chang, R. M., Kauffman, R. J., & Kwon, Y. (2014). Understanding the paradigm shift to computational social science in the presence of big data. Decision Support Systems, 63, 67-80.
⑩江彦生、陈昇玮:《简介“计算社会学”:一个结合计算机与数字科技的新兴社会学研究》,《台湾社会学》2016年总第32期。
[11]罗玮、罗教讲:《新计算社会学:大数据时代的社会学研究》,《社会学研究》2015年第3期。
[12]陈浩、乐国安、李萌、董颖红:《计算社会科学:社会科学与信息科学的共同机遇》,《西南大学学报》(社会科学版)2013年第3期。
[13]王成军:《计算传播学的起源、概念和应用》,《编辑学刊》2016年第3期。
[14]Anderson, C. W. (2013).Towards a Sociology of Computational and Algorithmic Journalism. New Media and Society, 15(7), 1005-1021.
[15]Gynnild, A. (2014). Journalism innovation leads to innovation journalism: The impact of computational exploration on changing mindsets. Journalism, 15(6), 713-730.
[16]Diakopoulos, N. (2015). Algorithmic accountability: Journalistic investigation of computational power structures. Digital Journalism, 3(3), 398-415.
[17]Lewis, S. C., & Usher, N. (2014). Code, collaboration, and the future of journalism: A case study of the Hacks/Hackers global network. Digital Journalism, 2(3), 383-393.
[18]Flew, T., Spurgeon, C., Daniel, A., & Swift, A. (2012). The promise of computational journalism. Journalism Practice, 6(2), 157-171.
[19]Stavelin,E. (2013). Computational Journalism: When Journalism Meets Programming. PhD thesisi,p.22. Norway: University of Bergen.
[20]Lewis, S. C., & Westlund, O. (2016).Mapping the Human-Machine Divide in Journalism. In T. Witschge, C. W. Anderson, D. Domingo, & A. Hermida (Eds.), The SAGE Handbook of Digital Journalism(pp.341-353). New York: Sage.
[21]Powers, M. (2012). “In Forms That Are Familiar and Yet-to-Be Invented”:American Journalism and the Discourse of Technologically Specific Work. Journal of Communication Inquiry, 36(1), 24-43.
[22]Hamilton, J.T., & Turner,F.(2009).Accountability through Algorithm: Developing the Field of Computational Journalism. Report from Developing the Field of Computational Journalism. Center for Advanced Study in the Behavioral Sciences Summer Workshop,Stanford, CA.
[23]Coddington, M. (2015). Clarifying journalism’s quantitative turn: A typology for evaluating data journalism, computational journalism, and computer-assisted reporting. Digital Journalism, 3(3), 331-348.
[24]Diakopoulos, N. (2010).A Functional Roadmap for Innovation in Computational Journalism.http://www.nickdiakopoulos.com/wpcontent/uploads/2007/05/CJ_Whitepaper_Diakopoulos.pdf.
[25]Diakopoulos,N.(2016).Computational Journalism and the Emergence of News Platforms. In B. Franklin & S. Eldridge (Eds.), The Routledge Companion to Digital Journalism Studies. London: Routledge.
[26]Splendore, S. (2016). Quantitatively oriented forms of journalism and their epistemology. Sociology Compass, 10(5), 343-352.
[27]Karlsen,J.,& Stavelin,E.(2014).Computational Journalism in Norwegian Newsrooms. Journalism Practice, 8(1), 34-48.
[28]Coddington, M. (2015). Clarifying journalism’s quantitative turn: A typology for evaluating data journalism, computational journalism, and computer-assisted reporting. Digital Journalism, 3(3), 331-348.
[29]Ausserhofer,J., Gutounig,R., Oppermann,M., Matiasek,S., & Goldgruber,E.(2017).The datafication of data journalism scholarship: Focal points, methods, and research propositions for the investigation of data-intensive newswork. Journalism.
[30]Diakopoulos, N. (2016). Computational Journalism and the Emergence of News Platforms. In B. Franklin & S. Eldridge (Eds.), The Routledge Companion to Digital Journalism Studies. London: Routledge.
[31]Wing, J.M. (2006).Computational Thinking. Communications of the ACM, 49(3), pp.335-337.
[32]Taylor, M. (2010). How Journalists Can Incorporate Computational Thinking into Their Work.https://www.poynter.org/2010/how-journalists-can-incorporate-computational-thinking-into-their-work/104535/.
[33]Flew, T., Spurgeon,C., Daniel,A., & Swift,A.(2012). The Promise of Computational Journalism. Journalism Practice, 6(2), 157-171.
[34]Hamilton, J. T., & Turner, F. (2009). Accountability through algorithm: Developing the field of computational journalism. In Report from the Center for Advanced Study in the Behavioral Sciences, Summer Workshop, pp. 27-41.
[35]Cohen, S., Li, C., Yang, J., & Yu, C.(2011).Computational journalism: a call to arms to database researchers. In Proceedings of the 5th biennial conference on innovative data systems research. January 9-12, Asilomar, CA: ACM.
[36]Cohen, S., Hamilton, J. T., & Turner, F. (2011). Computational journalism. Communications of the ACM, 54(10), 66-71.
[37]Daniel, A., & Flew, T. (2010).The Guardian Reportage of the UK MP Expenses Scandal: a Case Study of Computational Journalism. In: Communications Policy and Research Forum 2010, 15-16 November 2010, Sydney.
[38]Flew, T., Spurgeon,C., Daniel,A., & Swift,A.(2012). The Promise of Computational Journalism. Journalism Practice, 6 (2), 157-171.
[39]白红义:《从技术创新到新闻创新:重塑新闻业的探索性框架》,《南京社会科学》2016年第10期。
[40]Anderson, C. W. (2013).Towards a Sociology of Computational and Algorithmic Journalism. New Media and Society, 15(7), 1005-1021.
[41]Hammond,P.(2017).From computer-assisted to data-driven: Journalism and Big Data.Journalism,18(4),408-424.
[42]Splendore, S. (2016). Quantitatively oriented forms of journalism and their epistemology. Sociology Compass, 10(5), 343-352.
[43]Tabary, C., Provost, A. M., & Trottier, A. (2016). Data journalism’s actors, practices and skills: A case study from Quebec. Journalism, 17(1), 66-84.
[44]Borges-Rey,E.(2016).Unravelling Data Journalism. Journalism Practice, 10(7), 833-843.
[45]Borges-Rey, E. (2017). Towards an epistemology of data journalism in the devolved nations of the United Kingdom: Changes and continuities in materiality, performativity and reflexivity. Journalism.
[46]De Maeyer, J., Libert, M., Domingo, D., Heinderyckx, F., & Le Cam, F. (2015). Waiting for Data Journalism: A qualitative assessment of the anecdotal take-up of data journalism in French-speaking Belgium. Digital Journalism, 3(3), 432-446.
[47]Appelgren,E.,& Nygren,G.(2014).Data Journalism in Sweden. Digital Journalism, 2(3), 394-405.
[48]Fink,K.,& Anderson, C. W. (2015).Data Journalism in the United States. Journalism Studies, 16(4), 467-481.
[49]Tandoc Jr, E. C., & Oh, S. K. (2015). Small Departures, Big Continuities? Norms, values, and routines in The Guardian’s big data journalism. Journalism Studies.
[50]Young, M. L., Hermida, A., & Fulda, J. (2017). What Makes for Great Data Journalism? A content analysis of data journalism awards finalists 2012-2015. Journalism Practice.
[51]Appelgren,E.(2017).An Illusion of Interactivity.Journalism Practice.
[52]Boyles,J.L.,& Meyer,E. (2016).Letting the Data Speak. Digital Journalism, 4(7), 944-954.
[53]Appelgren,E.(2016).Data Journalists Using Facebook. Nordicom Review, 37 (1), 1-14.
[54]Royal, C. (2012). The Journalist as Programmer: A Case Study of the New York Times Interactive News Technology Department. #ISOJ Journal, 2(1), 5-24.
[55]Parasie, S., & Dagiral,E.(2013).Data-driven Journalism and the Public Good:“Computer-assisted-reporters” and “programmer-journalists” in Chicago. New Media and Society, 15(6), 853-871.
[56]Parasie, S. (2015). Data-driven revelation? Epistemological tensions in investigative journalism in the age of “big data”. Digital Journalism, 3(3), 364-380.
[57]Weber,W., & Rall,H.(2013).“We are journalists”. Production Practices, Attitudes and a Case Study of the New York Times Newsroom. In Interaktive Infografiken (pp. 161-172). Springer Berlin Heidelberg.
[58]Karlsen,J.,& Stavelin,E.(2014).Computational Journalism in Norwegian Newsrooms. Journalism Practice, 8(1), 34-48.
[59]Hannaford,L.(2015).Computational journalism in the UK newsroom. Journalism Education, 4(1), 6-21.
[60]Lewis, S. C., & Usher, N. (2013). Open Source and Journalism: Toward New Frameworks for Imagining News Innovation. Media, Culture & Society, 35(5), 602-619.
[61]Lewis, S. C., & Usher, N. (2014). Code, collaboration, and the future of journalism: A case study of the Hacks/Hackers global network. Digital Journalism, 2(3), 383-393.
[62]Lewis, S. C., & Usher, N. (2016). Trading zones, boundary objects, and the pursuit of news innovation: A case study of journalists and programmers. Convergence, 22(5), 543-560.
[63]Hammond,P.(2017).From computer-assisted to data-driven: Journalism and Big Data.Journalism,18(4),408-424.
[64]Anderson, C.W. (2011). Deliberative, Agonistic, and Algorithmic Audiences: Journalism’s Vision of its Public in an Age of Audience Transparency. International Journal of Communication, 5, 529-547.
[65]Carlson, M. (2015). The robotic reporter: Automated journalism and the redefinition of labor, compositional forms, and journalistic authority. Digital Journalism, 3(3), 416-431.
[66]Carlson, M. (2016). Automated journalism: A posthuman future for digital news? In B. Franklin & S. Eldridge (Eds.), The Routledge Companion to Digital Journalism Studies (pp. 226-234). London: Routledge.
[67]Graefe, A. (2016). Guide to automated journalism. https://www.cjr.org/tow_center_reports/guide_to_automated_journalism.php.
[68]Carlson, M. (2016). Automated journalism: A posthuman future for digital news? In B. Franklin & S. Eldridge (Eds.), The Routledge Companion to Digital Journalism Studies (pp. 226-234). London: Routledge.
[69]Clerwall,C.(2014).Enter the Robot Journalist. Journalism Practice, 8(5), 519-531.
[70]Jung, J., Song, H., Kim, Y., Im, H., & Oh, S. (2017). Intrusion of software robots into journalism: The public’s and journalists’ perceptions of news written by algorithms and human journalists. Computers in Human Behavior, 71, 291-298.
[71]Kim, D., & Kim, S. (2017). Newspaper companies’ determinants in adopting robot journalism. Technological Forecasting and Social Change, 117, 184-195.
[72]Thurman, N., Drr, K., & Kunert, J. (2017). When Reporters Get Hands-on with Robo-Writing: Professionals consider automated journalism’s capabilities and consequences. Digital Journalism.
[73]Van Dalen, A. (2012). The algorithms behind the headlines: How machine-written news redefines the core skills of human journalists. Journalism Practice, 6(5-6), 648-658.
[74]Latar, N. L. (2015). The robot journalist in the age of social physics: the end of human journalism?. In G.Einav(Eds.), the New World of Transitioned Media (pp. 65-80). Springer International Publishing.
[75]Carlson, M. (2015). The robotic reporter: Automated journalism and the redefinition of labor, compositional forms, and journalistic authority. Digital Journalism, 3(3), 416-431.
[76]Bucher, T. (2016).Algorithms as New Objects of Journalism, in M. Eide, H. Sjvaag, and L.O.Larsen (Eds.), Journalism Re-examined. Digital Challenges & Professional Reorientations(pp.87-104). Intellect.
[77]Linden, C. G. (2017). Decades of Automation in the Newsroom: Why are there still so many jobs in journalism? Digital Journalism, 5(2), 123-140.
[78]Lewis, S.C. (2015). Journalism in an Era of Big Data. Digital Journalism, 3(3), 321-330.
[79]Coddington, M. (2015). Clarifying journalism’s quantitative turn: A typology for evaluating data journalism, computational journalism, and computer-assisted reporting. Digital Journalism, 3(3), 331-348.
[80]Splendore, S. (2016). Quantitatively oriented forms of journalism and their epistemology. Sociology Compass, 10(5), 343-352.
[81]Boczkowski, P. J. (2015). The material turn in the study of journalism: Some hopeful and cautionary remarks from an early explorer. Journalism, 16(1), 65-68.
[82]Lewis, S. C., & Usher, N. (2016). Trading zones, boundary objects, and the pursuit of news innovation: A case study of journalists and programmers. Convergence, 22(5), 543-560.
[83]Carlson, M. (2015). The robotic reporter: Automated journalism and the redefinition of labor, compositional forms, and journalistic authority. Digital Journalism, 3(3), 416-431.
[84]Anderson, C. W. (2013). Towards a sociology of computational and algorithmic journalism. New media and society, 15(7), 1005-1021.
[85]Lewis, S.C. (2015). Journalism in an Era of Big Data. Digital Journalism, 3(3), 321-330.
[86]Kleis Nielsen, R., & Ganter, S. A. (2017). Dealing with digital intermediaries: A case study of the relations between publishers and platforms. New Media and Society.
[87]Bell,E. ,& Owen,T.(2017).The Platform Press: How Silicon Valley reengineered journalism .Tow Center for Digital Journalism,http://towcenter.org/wp-content/uploads/2017/03/ The_Platform_Press_Tow_Report_2017.pdf.
[88]VDeVito, M. A. (2016). From editors to algorithms. Digital Journalism, DOI:10.1080/21670811.2016.1178592; Lokot, T., & Diakopoulos, N. (2016). News bots: Automating news and information dissemination on Twitter. Digital Journalism, 4(6), 682-699.
[89]Carlson, M. (2017). Facebook in the news: Social media, journalism, and public responsibility following the 2016 Trending Topics controversy. Digital Journalism.
[90]Stavelin,E. (2013). Computational Journalism: When Journalism Meets Programming. PhD thesisi,p.13. Norway: University of Bergen.
[91]Stavelin,E. (2013). Computational Journalism: When Journalism Meets Programming. PhD thesisi,p.23. Norway: University of Bergen.
[92]Anderson, C. W., & De Maeyer, J. (2015). Objects of journalism and the news. Journalism, 16(1), 3-9.
〔责任编辑:御 风〕
Computation as New Objects of Journalism
Bai Hongyi
Abstract:The quantitatively oriented journalism has become a prominent trend in contemporary journalism. Researchers have used a number of different terms to refer to various news work related to data, computing, algorithms, applications, interactions, and so on. This article summarizes computational journalism as a concept about all kinds of datarelated journalism practice, and finally puts forward three paths to promote the future research about computational journalism.
Key words:computational journalism; algorithms; automation; big data