观点+访谈|王成军:跨越网络的门槛——社交媒体上的信息扩散

1 minute read

Published:

观点+访谈|王成军:跨越网络的门槛——社交媒体上的信息扩散(数字交往第39期)

本期目录

一、导读

(作者:曲飞帆)

二、观点摘录

(作者:王成军)

三、访谈

(对谈人:王成军 曲飞帆)

导读

“如果处理得当,基于互联网上的传播和互动数据可以变革我们对于人类群体行为的理解。”这句话来自计算社会科学家邓肯·瓦茨。2007年,邓肯·瓦茨在Nature杂志发文(Watts,2007)指出,社会科学是21世纪的科学。社会系统由海量的异质性个体构成,这些个体之间的互动,使得社会过程充满了复杂性。相比于自然科学,社会科学内部的复杂性更高,也更难研究。人类对于自然现象当中的很多规律已经非常了解,但对于社会现象的理解依然非常有限。互联网的发展和大数据的勃兴为研究复杂的社会现象提供了便利条件。

回顾互联网的发展历程,如果说Web 1.0时期是由网站提供内容、用户阅读内容的门户网站时代,那么Web 2.0时期就是由用户分享和生成内容的社交媒体时代。在web 3.0这一充满区块链气质的元宇宙时代到来之前,我们不妨通过一些关键概念和实证研究,重新审视社交媒体时代的传播现象,以期更好地发掘那些藏在人类未来生活形态中的传播基因。

Web 2.0以来的网络社会是人类基于计算机网络的社会关系的总和(杜骏飞、李永刚、孔繁斌,2015)。人们在社交媒体上展开数字交往,留下无数的数字指纹,这为研究者观察信息扩散这一古老命题赋予了新的契机。信息扩散是一种普遍存在的传播现象,在人类生活中扮演着重要角色。社交媒体平台及其与公众之间的相互作用,对信息扩散的机制产生了深刻影响,并带来很多新的、亟待解决的问题。例如——

  • 为什么大多数信息无法实现病毒式扩散呢?
  • 什么类型的信息具有病毒式扩散的特性?
  • 意见领袖(人际渠道)和热搜榜单(群体把关),哪一个才是新闻扩散的主要驱动力?
  • 为什么新出现的媒介产品仅短暂“火”过一段时间后,就从公众注意力中消失了?
  • ……

本公众号今日推送计算传播学研究者、南京大学新闻传播学院副教授王成军老师的新书——《跨越网络的门槛: 社交媒体上的信息扩散》。该书采用计算传播学的研究路径:围绕重要的传播学问题,基于已有理论和文献建立研究框架,系统地从不同社交媒体收集大规模的人类传播行为数据,通过计算机科学的算法对人类行为进行测量并分析其行为模式,采用统计模型对背后的社会机制进行建模,以便更好地理解关于人类传播行为的困惑。王成军(2022)认为,该书最重要的发现在于社会网络不仅会推动信息扩散,也会抑制信息扩散。另外,本书还对计算传播学进行了展望,从布鲁诺·拉图尔提出的“计算中心”的概念对计算社会科学的逻辑进行了反思。

Tips:该书定位为社会科学专业书籍,适合对新媒体、计算传播学、计算社会科学感兴趣的研究生和学生阅读,对互联网行业的从业者也有参考价值。

曲飞帆,南京大学社会学院助理研究员

观点摘录

1.回顾信息扩散相关理论

自柏拉图创立理念论以来,人类对理念世界追寻的脚步就从未停歇。然而,遗憾的是,人类在生活世界中的行为是如此生动具体,远非理念那么简单。从微博上的新闻转发到信息扩散理论之间隔着一个抽象的阶梯。如果沿着这一阶梯爬得太高,就进入了宏大理论的迷雾当中。反之,如果抽象程度过低,就仍然处于滚滚红尘之中,使得观察世界的视野过于狭窄,难以同更广阔的研究脉络对话。社会科学的发展一度或沉迷于玄奥的宏大理论,或局限于抽象的实证主义,引发米尔斯的反思和批判(Mills,1959)。解决这一问题的重要思路是默顿所提出的“中层理论”,沿用至今 (Merton, 1949)。

幸运的是,关于信息扩散的研究已经积累了大量的中层理论。例如,两级传播理论 (Katz,1957;Katz and Lazarsfeld,1955)、新闻扩散理论 (Greenberg,1964b;Larsen and Ffill,1954;Miller,1945)、创新扩散理论(Rogers,1983)、门槛模型(Granovetter,1978;Granovetter & Soong,1983,1986,1988;Valente,1993,1995,1996)、巴斯扩散模型(Bass,1969,2004)、传染病模型(Anderson & May,1992)。本书首先回顾了信息扩散的相关理论观点,在此基础上,对网络信息扩散的研究议程进行讨论。

(详见第二章,第13页)

2.如何认识现有的理论?——理论是一棵树

理论是逻辑的组合,可以使用三个比喻来进行理解(Griffin,2009)。首先,理论是一个渔网,可以帮助人们看清概念与概念之间的逻辑关系,进而帮助研究者“打捞”现实中的新问题、新现象。其次,理论是一个透镜,可以帮助人们超越个人的能力,看到遥远的地方或者微小的细节。最后,理论是一张地图,可以让人们知道现在站在哪里、前进的方向以及要同什么理论或学派对话。

就单个研究而言,可以将理论建构的过程看作一个沙漏。既然是沙漏,自然存在一个既定的时间箭头:按照文字流动的顺序可以将一篇论文按照“学术八股文”的写法分为引言、理论框架、研究方法、研究发现、结论与讨论五个部分。

从理论建构的角度来看,在社会科学当中最为流行的传统是开展理论驱动的实证研究。首先,引言需要找到一个研究困惑,采用己有的理论没有办法直接解决,甚至两个理论之间存在直接的矛盾,因而需要发展既有的理论或者提出新的理论来回答这一困惑;其次,理论框架部分需要围绕研究困惑综述既有的文献,厘清已有理论脉络的逻辑,提出操作化的假设或者研究问题,搭建自己的理论框架;再次,在研究方法部分介绍使用的数据、概念的测量以及分析方法;接下来,在结果部分检验操作化的假设、回答操作化的研究问题;最后,在结论与讨论部分回到理论的高度,与已有的理论和研究对话,总结文章的贡献和不足。

一开始,研究是从一个很宽广的困惑切入的;然后,进入理论框架后,研究开始变得狭小;进入到研究方法(尤其是数据部分),整个研究来到沙漏中间最为狭窄的部分;介绍研究发现的时候,研究视野重新变得开阔;到了结论与讨论部分,研究再次回到整个理论版图,研究的视野重新变得非常广阔。有趣的是,整个沙漏是可以翻转过来流动的。实际的论文写作过程往往并不严格按照沙漏流动的顺序展开。比如,人们可以先写容易写的部分(尤其是研究方法、研究发现),然后回到文献综述部分构建理论框架,最后写引言。但是,最终整个研究的逻辑线索需要是一以贯之的。

笔者认为理论是一棵树。理论之树根植于现实生活深厚的土壤当中;理论之树的根系代表了构建理论的核心逻辑脉络或传统;对于一棵树而言,最关键的部分当然是自己的树干,它代表了理论的核心框架,将理论脉络与论据、论证、核心观点等部分联系起来;树枝代表了理论的操作化假设,它从理论之树的躯干上延伸出来,连接着树叶和果实;树叶代表了论证,它们通过光合作用为理论假设提供了充足的资源;阳光和空气是论据,它们可以支撑作为论证的树叶;最后,一个理论之树应该结出丰硕的果实,也就是对于社会现实的理论解释。

这种理解的精彩之处在于唤醒沉醉于理论迷雾中的人。不是所有的理论都是参天大树,还有很多是灌木、藤蔓,甚至是小草。作为一棵树,自然存在一个生长的生命周期。必然可能会面临走向死亡和被替代的结果。然而,仰赖大树生存的人可能并不甘心看到这一结果。

(详见第二章,第33-34页)

3.从ABX模型到ABXC模型,再到ABXCT模型

ABX模型:社会心理学家Heider(1946)意识到忽略个体之间的互动以及个体与信息间的关系将会带来严重的问题,据此提出平衡理论,将认知一致性动机概念化为心理平衡的驱动力。Newcomb(1953)基于平衡理论提出ABX模型,同样试图捕捉传播过程中的互动关系,表征了两个体之间的动态传播关系(McQuail and Windahl,1993)。在Newcomb的ABX模型中,传播在帮助个人保持外部对象(如第三个人或信息)的同步中起着关键作用。Festinger(1957)的认知失调理论拓展了ABX模型,认为A和B两人之间存在互动关系,并且他们会分别接触X。A和B对于X的不一致认知可能会刺激他们之间的沟通和交流,从而恢复A和B之间的平衡关系。

ABXC模型:ABX模型仅关注微观层面上社交网络内部的人际互动,对宏观层面的外生冲击没有充分讨论。Westley和MacLean(1957)保留了人际传播的互动性,对Newcomb的ABX模型进行了改造,已提供更为复杂的大众传播过程的表征。他们先后将大众媒体C添加至ABX模型,将X拓展为X1到Xn,用来表示社会系统中的任意社会事件或对象,还将反馈添加到ABX模型。为了保持模型的简约,Westley和MacLean并没有将政治、社会、文化和商业力量纳入ABXC模型,它仅纳入了那些在任何大众传播中必须有的、最少数量的角色和过程。它可能会因此而被误解,但对人们理解复杂的社会现象是有用的。

ABXCT模型:本书把渠道角色(C)和时间(T)加入进来,将ABX传播模型扩展为ABXCT模型,在ABXCT模型中,信息流通过传播渠道流入社会系统。例如,通过外部渠道(媒体、聚合类网站)、社交网络、搜索引擎等向公众传播信息。借助该模型,本书将从多个层次对信息扩散的驱动力进行分析。本书研究的重点是信息共享网站上的信息扩散,尤其是驱动信息扩散的因素(如外部影响、基于社交网络的人际作用、个人属性和内容特征)。

(详见第三章,第37-43页)

4.什么样的信息可以跨越网络门槛?——病毒式叙事

什么样的信息可以跨越网络的门槛?答案或许是病毒式叙事。叙事的传染才是实现全局性扩散的基因。正如《小王子》(Le Petit Prince)一书的作者安托万·德·圣-埃克苏佩里所言:“如果你想造一艘船,先要做的不是催促人们去收集木材,也不是忙着分配工作和发布命令,而是激起他们对浩瀚无垠的大海的向往。”

(详见第四章,第69页)

5.群体把关如何助推新闻扩散?

群体把关在互联网平台上广泛存在。例如,热搜在新浪微博中发挥着举足轻重的作用。粉丝经济和商业利益与群体把关结合起来,粉丝成为娱乐类信息扩散的群体把关人,并通过热搜排名推动信息的扩散和出圈。群体把关体现了早期扩散者的力量。如果早期扩散者缺乏公共意识,经由群体把关产生的热搜排行榜就可能丧失公共性。

(详见第五章,第83页)

6.数字媒介是一个虚拟生命体

作为数字生态环境中的“物种”,媒介产品存活的先决条件是公众注意力的分配。换言之,公众注意力流动的结果决定了媒介产品的流行度。然而,由于公众注意力有限,媒介产品必须经过激烈的竞争才能生存。一个自然结果就是媒介产品的暂时性:新出现的媒介产品或许引人注目,但仅短暂“火”过一段时间后,就从公众注意力中消失了。

基于新陈代谢的生物学视角,可以将数字媒介看作一个虚拟生命体,它的生长以用户的注意力为养料或能量。数字媒介作为生命体,主要功能是为用户提供海量的信息。如果数字媒介是一种虚拟生命,就可以测量它们的新陈代谢率。新陈代谢率可以通过测量生命体每秒钟维持存活所消耗的能量来衡量。对于人类而言,人们主要关注基础代谢率(basal metabolic rate)。基础代谢率是指人体维持体温、血液循环、呼吸等基本生理活动的能量代谢率。根据West(2017)的介绍,一个人每天需要摄入2000卡路里的热量,相当于90瓦特的代谢率,与一只白织灯的电功率相当。显然,生命体是非常节能的,或者说生命体对能量的使用非常高效。然而,随着现代化和城市化的进程,人类消耗的能量越来越多。除了需要煮饭、照明、使用空调、开车之外,现代人还需要使用手机、电视、电脑等工具。因此,维持现代人生活所需要的能量大幅度提高,人类的实际代谢率也在快速增长。West 将现代社会中的人类的新陈代谢率称为“社会代谢率”(social metabolic rate)。与之类似,可以定义虚拟代谢率 (virtual metabolic rate)来衡量数字媒介的能量消耗。可以将一个数字媒介的页面浏览量 (page views,PV)看作维持其生长所需要的能量,将独立访问者 (unique visitors,UV)的数量看作数字媒介的总规模或体重。页面浏览量 PV 代表了数字媒介为了维持其虚拟生命所需要的注意力能量。吸收了这些能量之后,作为虚拟生命的数字媒介生产了大量的信息,进一步帮助数字媒介吸引到更多的注意力资源,这样的过程带来了虚拟生命体的异速生长 (allometric growth)。

(详见第六章,第101-102页)

7.通往计算叙事的道路

计算方法的发展使得分析叙事的结构成为可能。自然语言处理和深度学习方法为理解叙事提供了基础。基于自然语言处理和深度学习,研究者提出了词向量嵌入的方法。使用这种方法可以将任意一个词嵌入到一个有限维度的高维空间,这个语义空间表征了词语之间的语义关系。基于词语的坐标(或者说向量)可以定位一个文本在这个语义空间的位置,还可以计算不同时间窗口中的文本的位置。有了这些空间坐标的数据,就可以探索任意两个词之间的余弦相似性,并可以计算它们之间的距离。Toubia等 (2021)对语义空间的分析是一个很好的例子,它们不仅计算了距离,还纳入时间和空间的逻辑,进一步计算了叙事速度、容量和迂回。Boyd等(2020)则给出了另外一种计算的思路,基于LIWC 字典当中的功能词者和认知紧张词列表刻画了叙事结构当中的舞台搭建、情节发展和认知紧张。与之类似,道兹和他的合作者们则构建了情感字典来刻画故事中的情感曲线(Reagan et al., 2016)。Xu等(2019)综合使用了情感字典和词向量嵌入的方法,刻画男女主角的情感曲线。希勒(Shiller,2020)在《叙事经济学》一书尝试将病毒性叙事纳入对人类行为的分析中,基于时间序列的方式捕捉经济叙事对社会现实的影响。通往计算叙事的道路已经基本铺好了。信息扩散、注意力流动到计算叙事,构成了笔者过去十年学术研究的一条主线。

(详见第七章,第135页)

8.计算传播学≠计算方法

计算传播学以发展理论或者说理解人类行为为根本目的,这种研究起源于重要的社会科学问题,其主要的驱动力则来自大规模数据和计算方法。因此,认为计算传播学主要是计算方法是一种常见的误解。计算方法以及大数据通常是外界给计算传播学研究者贴的标签,却不是计算传播学研究者认同的身份定位。与之类似的一个问题是:计算传播学如何思考理论或有什么理论贡献?事实上,这样的提问也有失公允。这让人想起霍华德。贝克尔(Howard Becker) 在其名著《社会学家的窍门》(Tricks of the Trade)中讲到他的导师埃弗里特 •休斯 (Everett Hughes)的故事。当一群学生围着休斯请教该如何思考理论时,休斯气呼呼地瞪着学生们反问:“关于什么的理论?”休斯认为宏大理论是没有价值的,理论是与具体的事物相关的。计算传播直接对应的具体事物是计算传播现象和计算传播产业。比如,现在人们都在关注以推荐系统为主要特点的智能媒体对政治极化的影响。如果不去关注这些计算传播现象、不去追踪智能媒体上的人类传播行为、不去测量推荐系统所引入的偏见,就很难回答这种问题。再举一个例子,当大家都在谈论推特上的假新闻扩散,并好奇真新闻和假新闻究竟在扩散过程中有什么区别时,如果不去收集新闻在推特上的扩散数据、构建扩散网络并细致地刻画扩散规模、扩散时间、扩散深度、扩散宽度、病毒式扩散特性、内容的新奇程度等特征,就很难给出具有说服力的答案。

(详见第十章,第188页)

更多内容,欢迎继续阅读

1.王老师好,您在书中有介绍,该研究主要想去理解的一项困惑,即进入21世纪之后,随着市场营销、计算机、网络科学等学科的发展,越来越多的研究者通过实证分析发现“大规模的信息扩散是罕见且难以预测的”,与人们基于主观感知得到的“病毒式信息扩散”观念相反。然而,这里是否还存在一种可能,即已有实证分析仅仅通过网络行为数据依然难以监测到“信息扩散过程”的全貌,存在马修·萨尔加尼克(2019)指出的数据不完整性问题,因而最终只能得出了信息扩散有限性的结论。您对此怎么看?

我最初做“信息扩散的瓶颈”时,主要是与网络科学理论中的病毒扩散模型进行对话。该类研究特别乐观,认为在网络结构当中,信息扩散的门槛会消失!这是一个非常耸人听闻的结论。这种研究结论很契合人们的一种常识,也增强了人们对于病毒式信息扩散的认同。然而,现实生活中,你也会看到大量反面的例子,比如我们自己的公众号文章想要获得10万+的阅读量是一件很难的事情。我们既能看到很多信息扩散成功的经验,也能看到很多失败的经验,这就看你怎么选择常识、如何选择性记忆。很多时候,“网红”类信息更能引起我们注意,但这是信息层层过滤后呈现给我们的结果,我们不知道有多少信息在扩散的道路上很早就“死”掉了。

信息扩散路径包含线上和线下,但如今我们仅能借助数据看到信息在线上扩散的情况。可以确定绝大多数线上的信息扩散是有限的,出圈的、大规模扩散的是极少数的,符合二八定律或者说幂律。如果能把信息在线下扩散的全貌也捕捉到,分析它究竟是大规模扩散还是有限扩散,那将是一个更加有趣的问题。

2.马修·萨尔加尼克在《计算社会学》中指出,为了应对调查误差,数字时代提倡三种借助计算机工具的研究方法,分别是生态瞬时评估法、维基调查和游戏化。您如何看待这三种研究方法?

马修·萨尔加尼克(Matthew J. Salganik)是一个很有创见的社会学家,也是小世界模型提出者邓肯·瓦茨(Ducan Watts)的学生。马修·萨尔加尼克在《BIT BY BIT》(《计算社会学》原名)这本书里,既讲到了大数据,也讲到了调查、实验、大规模协作等新方法,还有新方法的道德伦理问题。传统调查研究方法在数字时代面临拒访率较高的问题,使得一些花费了很多人力物力财力的调查数据也失去了代表性,不过,目前也有研究者尝试通过事后分层加权等思路来解决这一问题。

关于三种提问的新方法,它们实际上并不仅仅是为了解决误差问题,而是为了改进提问方法以便收集之前无法收集到的数据。比如针对采访时机的局限,他们创造了生态瞬时评估法;根据政府了解公众所真正关心问题的需求,他们创造了维基调查;针对调查过程太过枯燥和受访对象参与度不足的问题,他们提倡游戏化的提问方式。可以想象,以后还会有更多新的提问方法被研究者创造出来。

我们也有考虑设计一款游戏,通过吸引大家参与来收集数据。但开发一款游戏,需要与制作APP的工程师合作,需要很多资金的支持,还需要考虑如何让游戏对受访者有用。维基调查的方法,我们已经在小规模的使用了。我在上课的时候会用马修·萨尔加尼克搭建好的网站,请学生去填“如何提高教学质量”的建议。而生态瞬时评估法,它适合去验证微小情境对人的影响,人类有很多行为并非出于结构因素或理性思考,而是在激情之下决定的。捕捉这一微小情境,对于有些问题而言不重要,但对于另外一些问题而言就很重要。比如书中提到的内奥迷·杉江(Naomi Sugie),她对于美国出狱人群社会融入问题感兴趣。有关出狱人员行为和情绪状态的细微、纵向的详细数据,对于理解他们所面临的障碍、降低他们重返社会的难度有着重要意义。我感觉新方法是可遇而不可求的,需要与研究对象、研究问题相契合。

注:1.生态瞬时评估法:该方法将传统的调查分解,然后融入参与者的生活,研究者可以在合适的时间和地点进行提问,而不是在事情发生数周后才通过一个长时间的访谈来了解。2.维基调查:基于参与者想法而逐步展开的调查,该方法为封闭式提问和开放式提问的结合提供了新的可能,研究者通过创建与维基调查类似的网站来获取参与者的想法。一般需要满足三个特性——贪婪性、协作性和适应性。3.游戏化:考虑到计算机管理的调查既费时又枯燥,调查设计者在设计过程中不得不考虑参与者的想法,以便使回答问题的过程更愉快、更像游戏,这一过程被称为游戏化。(参考马修·萨尔加尼克《计算社会学:数据时代的社会研究》,第102-114页。)

3.您在该书序言里提及,“本书要解决的核心问题源于信息扩散研究领域的一个重要困惑:与分析模型的预测结果相反,实证研究者们不断发现大规模扩散实际上是罕见且脆弱的。”您认为,研究者应该如何找到自己的核心困惑?

不是所有的数据都有意义,只有那些和重要的研究困惑相关的数据才有意义。我们很多研究都需要有一个核心的困惑,提出研究困惑是一个很重要的能力。研究困惑在英文里对应的词组应该是research puzzlement,与research gaps相近,后者指已有研究当中存在的不连续、断裂、冲突和矛盾的地方。研究困惑可以来自既有理论之间的矛盾,也可以来自理论和现实之间的矛盾。对于初学者而言,确实不太容易找到一个真正的困惑,这需要足够的生活经验和学术储备。

比如,人们在下雨天能否打到的士?人们的现实感受是“在下雨天不容易打到的士”,但新古典经济学家告诉我们,下雨天的乘客更多,司机更愿意加班;但行为经济学家认为,司机在下雨天会很快赚够平时的收入,然后就提前下班了。两个理论谁对谁错?这就产生了理论之间的矛盾。

你会发现,提出一个核心困惑,既需要针对同一个现象了解人们的现实感受和相应的理论解释,还需要针对同一个问题去了解不同的理论。当你看到两棵很强壮的“树”,一边是行为经济学,一边是新古典经济学,它们对一个问题的解释产生了巨大的矛盾和张力,如果我能测一测谁对谁错,就会做出巨大的理论贡献。因此,想要提出核心困惑,需要真正去了解这两个或多个理论,并能够用这些理论去解释社会现实,知道它们之间的矛盾冲突。

理论驱动的实证研究需要研究者积累理论,将解释同一个现象的不同理论之间的张力展现出来。对于初学者而言,只是去推翻一个理论,难度很大,只是去给一个理论“戴帽子”,又太过容易。建议初学者站在两个“斗来斗去”的理论之间,参与理论对话。例如,邓肯·瓦茨(Duncan Watts)就曾指出:关于信息扩散,经济学家比赫昌达尼(Bikhchandani)提出信息瀑流的社会学习模型(social-learning model),社会学家格兰诺维特(Granovetter)则提出了门槛模型(threshold model),两个模型都对社会系统中的扩散现象进行了很好的解释,然而,门槛模型认为个体观察其他人行为的顺序非常重要,直接决定了扩散的结果,但社会学习模型认为这种顺序无关宏旨,两个模型在基本假设上存在矛盾。

4.接着上一个问题,邓肯·瓦茨(Watts,2014,2017)曾主张社会科学研究者必须要在好故事和好理论之间进行抉择。他认为,社会科学应当以解决问题为核心,要更加重视采用已有的理论和模型进行预测,而非一味执着于发展理论。您如何理解瓦茨的这段话?

瓦茨讲这段话有一个背景,他原来的专业是物理学和网络科学,后来转行做社会学的研究。他很喜欢社会学,也受到了很多启发,但他同时发现,大量发表的社会学论文都在讲故事,他们会提供一种很主观、自洽的解释,但不是科学的解释。例如,诠释主义的支持者觉得社会科学的职责就是诠释,但这会导致很多研究者只是根据自己所属的派别和品位,去选择相应的理论来讲故事。瓦茨更倾向于用科学的方法做解释。然而,有时候很多科学的解释也不一定是好故事。瓦茨这段话体现了学者们对于“社会科学应该是什么”这一基本问题存在分歧。

5.本书第51页提及,门槛理论最重要的假设是效用-成本假设,其前提是认为个体在日常生活中常常需要做出各种各样的选择并承担做出选择的责任,这显然是一种具有理性人预设的理论。然而,在32页,您又提及了自己对于罗伯特·希勒“叙事经济学”的欣赏,而叙事经济学非常强调非理性因素对于人类经济行为的重要性。那么您如何看待这两种元预设之间的关系,您认为未来的计算叙事研究将如何融合这两种预设?

计算叙事是后拿进来的,这本书写到后面,我捕捉到绝大多数扩散不出去的信息,但反过来去想,为何有些信息可以出圈,能够成为流行性信息?除了偶然的原因,是不是也有一种结构性的因素在里面?不仅理性的因素能够解释一部分,非理性的因素也能解释一部分。显然,结合叙事经济学能够给出更好的解释,我想从这个角度弥补之前思考的不足。

这实际上也涉及人们对社会科学的理解。一开始,社会科学基本上是在模仿自然科学。自然科学走的是一条理性主义道路,柏拉图提出了理念论,认为这个世界最强大的、永恒不变的东西是人的理念,所以他主张发展数学和各种模型。自然科学沿着理念论这条道路走得很成功。社会科学也想要沿着这条道路去研究人类社会。然而,慢慢地,大家发现不是那么回事。达尔文指出,人类社会的本质在于变异性,正是因为所有人都不一样,种群才得以繁衍;如果所有人完全一样,温度骤变,人类就灭绝了。人类世界的好处就是参差不齐,但又能够相互容忍,各美其美,美美与共。达尔文的表弟高尔顿进一步认为,社会学的目标不是寻找永恒不变的法则,而是去寻找变异和共变。以上这两套逻辑没有谁对谁错,各有利弊,社会科学的发展应该是两边都能够兼顾,既要有坚固的东西,又要有柔软的东西。

刚进入一个研究领域,你有可能运用物理社会学的观念去找出一些结构性的因素,去做一些柏拉图式的工作、建构理性模型。但理性因素总会有枯竭的时候,有它的应用范围。当理性因素解释差不多了,剩下的比较软的部分就需要叙事负责解释。似乎我们只能针对某一个阶段的某一个问题,选择更合理的解释。

6.本书的第七章延伸介绍了计算叙事,提到计算方法的发展使得分析叙事的结构成为可能。那么,现学现用,如果X轴是年龄,Y轴是科研能力,您能否为自己已经历的学术生涯画一条故事形状?

刚进入大学,一开始是没有科研能力的,在本科读了很多经典理论,但只能欣赏,没有办法去论证,科研能力没有明显提升;读研后,科研能力主要在研究方法层面有了提升;读博之后,研究方法能力的提升很快面临一个瓶颈期,即使选了一个题目,看了一些理论,依然难以提出更好的观点。这时就需要因缘际会,找更多人去讨论。当我意识到新闻扩散的J形曲线模型和门槛模型的两个理论存在冲突的时候,才在研究困惑的理论层面有了新的提升;参加工作之后,主要做了一些注意力流动的研究,但在思想上没有太大的突破。疫情出现之后,我听了一些播客,阅读了一些书籍,尤其是接触了叙事经济学的观点,才有了一些改观。我觉得目前为止,自己的科研能力是一个台阶一个台阶往上走的,研究方法训练、理论比较能力、跨学科视角都是提升科研能力的关键要素。也许很厉害的学者会在一个阶段集齐全部要素,但更多的学者可能需要一步步完成,我们会先后经历“无知之巅”、“绝望之谷”,最后来到“开悟之坡”。陷入绝望之谷的时候不要太悲观,例如参加工作后,为了“生存”,不仅要去做研究,还要考虑如何将研究成果发表出来,也许会面临很多次拒稿。要从拒稿中坚持下去,提高能力,慢慢会有新的曙光和机会。

image

图 王成军老师学术生涯手绘稿

7.书中最后一章提到,计算社会科学研究者需要追踪各种各样的数字媒介、掌握崭新的算法、搭建更强大的硬件设备、建立更强的社会联系,尤其重要的是需要建立属于自己的计算中心来更好地探索全局化的知识。那么对于那些希望致力于计算社会科学的年轻学者,您有什么建议或忠告么?

每个人的经历不一样,没有办法去想象别人走过的道路。但有一个建议,那就是去感受时代精神是否存在一个结构性的转型。我当时就遇到一个机会,就是2009年左右,计算社会科学刚刚兴起,对传播学的启示还没有被广泛注意到。当时已经有了社交媒体和大规模的数据,我们就想在这个方面做一些工作。后来,慢慢建立了计算传播学社区,在国内新闻传播史学会下面成立了计算传播学专业委员会,在国际传播学会(International Communication Associaion)下面建立了Communication Method分会。我自己在豆瓣也先后建立了“计算传播学”和“苏格拉底学园”两个学习小组。计算传播学的浪潮今日尤在,但是产生了一种不太平均的局面:有能力、有资源的人更容易去做;反之,则需要积累更长的时间,这是一个挑战。

8.回到一个老生常谈却又常谈常新的问题,除却数据收集和分析的黑箱问题,书中还提及,计算社会科学面临来自大数据的融合、治理、隐私、透明方面的挑战,您如何看待这些挑战?

这是一个非常现实的问题。大家都想分析和处理大数据,但大数据往往涉及个人隐私和伦理问题。如今,政府或企业不愿意公开数据的一个重要原因在于隐私和伦理问题,这也导致研究者很难拿到这些数据。于是,整个社会没有一个中立的第三方来分析这些数据。开放数据和维护隐私之间存在冲突,需要寻求一个制度化的解决方案。我们仍然需要公开和分享数据,但只能是有条件的和有范围的,必须以不侵害用户隐私、不引发伦理问题为基础。

image

图 南京大学新闻传播学院计算传播学实验中心

参考文献:

  • [1]杜骏飞,李永刚,孔繁斌(2015).虚拟社会管理的若干基本问题[J].当代传播(1):4-9.
  • [2]杜骏飞(2022).“未托邦”:元宇宙与Web3的思想笔记[J].新闻大学(6):19-34.
  • [3]马修·萨尔加尼克著(2019).计算社会学:数据时代的社会研究[M].赵红梅,赵婷译.北京:中信出版集团.
  • [4]王成军著(2022).跨越网络的门槛:社交媒体上的信息扩散[M].北京:科学出版社。
  • [5] Watts,D.J. 2007. A twenty-first century science. Nature,445(7127),489.
  • [6] Watts,D.J. 2014. Common Sense and Sociological Explanations. American Journal of Sociology, 120(2), 313-351.
  • [7] Watts,D.J. 2017. Should social science be more solution-oriented?.Nature Human Behaviour,1(1),1-5.