投稿问答最小化  关闭

万维书刊APP下载

周葆华等|数字时代的计算舆论研究:主题、理论与方法的进展与前瞻——基于2000-2020年代表性传播学国际期刊的分析

2023/12/26 17:20:20  阅读:106 发布者:

作者简介

周葆华,复旦大学信息与传播研究中心研究员,复旦大学新闻学院教授,全球传播全媒体研究院研究员,复旦大学国家发展与智能治理综合实验室研究员上海市数据科学重点实验室研究员。

连昕萌,复旦大学新闻学院博士生。

张思琪,复旦大学新闻学院硕士生。

杨天铸,复旦大学新闻学院硕士生。

     要:

大数据深刻影响了数字时代的舆论研究,其突出表现是计算舆论研究的兴起。本文选择2000-202012本代表性SSCI期刊,对200篇国际计算舆论研究文献进行内容分析,勾勒舆论研究领域的新变化。研究发现:计算舆论研究在2011年以来得到快速发展,在题材上以政治议题为中心,聚焦单一事件,侧重舆论内容和表达主体,聚焦“基于社交媒体的社会运动或集体行动舆论”等核心议题;理论概念集中于行动主义和社会运动,反思数字公共领域,重新检验框架、议程设置等经典概念,以及情绪、可供性等新兴概念;研究设计和方法上,动态舆论研究获得与静态研究同等的比重,但聚焦单一国家/社会、以及单一媒介平台的研究仍占多数,文本挖掘是最主要的数据采集与生成方式,不足三成的研究中同时包含小数据,经典统计、文本挖掘与网络分析是主要的数据分析方法。研究在此基础上提出理论化、跨事件/议题、跨国家/社会、跨时间、跨平台、跨模态、跨方法/数据的计算舆论研究未来发展路径。

   关键词:

计算传播;计算舆论;大数据;

一、研究缘起与介绍

二、计算舆论研究的概况与高被引文献

三、计算舆论研究的主题

四、计算舆论研究的理论概念

五、计算舆论研究的研究设计与方法

(一)研究设计:目标、时空与平台

(二)研究方法:数据采集与分析

六、结论与思考

一、研究缘起与介绍

数字时代的舆论生态正在发生重要改变:首先,就舆论表达主体而言,不但普通个人、群体和组织成为舆论表达主体,机器人、“水军”等灰色账号也在介入舆论内容的供给;其次,就舆论平台而言,互联网,特别是社交媒体成为舆论表达的重要平台,平台技术设施与架构对舆论运行影响巨大,其中社交机制和智能算法扮演了重要角色,对舆论的生成与演变起到重要组织作用;第三,舆论形态日益多元,不但包含文字,也包括

、音频、视频等丰富的多媒体形态;第四,舆论运行速度也日益加快,不但超越传统时空囿限、随时随地发生,而且藉由网络结构的连接与扩散,不断发生转折与变化,呈现快速演进与迭代的特征;最后,舆论影响或可能产生共识,但更易使意见分化,意见分割与舆论极已化成为常态。

舆论生态的变化也给舆论研究带来重大挑战。从小数据到大数据,传统的问卷调查、访谈等方法已不足以把握舆论过程与传播规律。随着以自动化编程手段、非介入(非自我报告)方法采集、处理和分析大数据为基本特征的计算方法在社会科学和传播研究中的兴起,它也开始在舆论研究中扮演重要角色。运用机器学习方法识别舆论表达主体、运用网络分析技术挖掘社群结构、运用自然语言处理技术挖掘舆论文本、运用网络方法和时间序列等刻画舆论过程、运用仿真方法模拟舆论演化……运用计算方法挖掘、分析舆论过程与结果的“计算舆论研究”(Computational Public Opinion Research)已经日趋普遍。2022年,国内外首部计算舆论学的著作也已问世。1但对计算舆论研究的系统梳理还尚付阙如。本研究因此希望通过对国际上有代表性SSCI期刊文献的分析,全面勾勒出计算舆论研究的进展与现状,并为计算舆论研究的进一步发展提供启示。我们致力于回答如下主要问题:第一,计算舆论研究主要涉及哪些主题?第二,计算舆论研究涉及哪些主要理论概念?第三,计算舆论研究的研究设计和方法运用呈现怎样的特征?

本文以12SSCI核心期刊为考察对象,梳理并分析2000-2020年间的国际计算舆论研究状况。所选取的国际性期刊包括:3本传播学综合性代表期刊——《传播学刊》(Journal of Communication)、《传播研究》(Communication Research)、《人类传播研究》(Human Communication Research);2本舆论研究代表期刊——《舆论学季刊》(Public Opinion Quarterly)、《国际舆论研究学刊》(International Journal of Public Opinion Research);2本政治传播研究代表期刊——《政治传播》(Political Communication)、《国际媒体/政治学刊》(The International Journal of Press/Politics);5本侧重新媒体研究的期刊——《新媒体与社会》(New Media & Society)、《计算机中介传播学刊》(Journal of Computer-Mediated Communication)、《信息、传播与社会》(Information, Communication & Society)、《网络心理学、行为与社交网络》(Cyberpsychology, Behavior, and Social Networking)和《社会科学计算机评论》(Social Science Computer Review)。研究围绕“计算”和“舆论”两个核心概念设计关键词组合2,在上述期刊的英文学术论文中进行检索,在初始获得的文献基础上,由4位经过培训的编码员通过标题、摘要逐一阅读,判断文章是否属于计算舆论研究,最终获得了N=200篇计算舆论研究论文。在分析部分,我们主要采取人工编码方式,对文献涉及的主题(议题)、理论(概念)、研究设计(包括目标、时间、空间和平台)、方法(包括数据采集与分析)等进行编码。编码员在经过培训和随机抽取10%的文献进行共同编码并达到理想的编码员间信度系数(Krippendorff's Alpha0.71-0.95之间)后分别展开编码。所有编码结果录入SPSS软件进行统计分析。此外,我们也运用R软件基于文献摘要进行LDA主题建模,以辅助探测计算舆论研究的主题。

二、计算舆论研究的概况与高被引文献

研究发现,计算舆论研究在20年间增长明显:2000-2010年之间仅有3篇文献;2011-2015年为39篇;2016-2020年则增长至158篇。在12本期刊中,刊载计算舆论研究最多的均为侧重新媒体研究的期刊,包括《信息、传播与社会》(ICS)(57篇,占比28.5%)、《新媒体与社会》(NMS)(43篇,21.5%)以及《社会科学计算机评论》(SSCR)(40篇,占比20.0%),说明这些新媒体期刊更可能拥抱新的计算方法。相比之下,老牌的舆论研究期刊则并非如此(如POQIJPOR只刊载了2篇计算舆论研究论文)。表1中列举了这12本期刊中的计算舆论研究高被引文献。

三、计算舆论研究的主题

计算舆论研究主要集中在哪些主题领域呢?首先,据统计发现,除5%的文献缺乏明确主题(说明:被引量为在SSCI数据库中的被引量,统计截止时间为2022519日)外,大多数计算舆论研究具有特定的主题(允许多选)。其中,政治类议题占比最多(占比48.5%),是计算舆论研究中的主流题材,研究者采用计算方法对大选中的在线讨论、投票意愿、党派意识形态竞争等舆论议题进行分析;随后依次是种族、法治、民生、环境、性别等议题(占比分别为10.5%8.5%7.0%7.0%6.5%),主要结合相关社会运动和热点事件的网络讨论进行分析,如#Me Too运动、#Black Lives Matter运动等;有关文体、经济、科技教育类的计算舆论研究主题相对较少(占比分别为4.5%4.5%2.5%)。

1   美国涉华舆论的核心话语

(说明:被引量为在SSCI数据库中的被引量,

统计截止时间为2022519日)

二是在所涉及的主题类型上,除10%的文献无法明确判断外,计算舆论研究在事件(event)、议题(issue)与人物(figure)三者中多聚焦于事件(占比49.0%),特别是单一事件(占比42.0%)(如斯图加特抵制运动、英国脱欧辩论等);其次是议题(占比37.0%),其中单一议题占比29.5%(如女权主义、反疫苗等),而对多个事件(7.0%)、多个议题(7.5%)以及人物(4.0%)的分析相对有限。

三是在研究内容方面,以传播研究经典的5W模型为框架,关注传播内容和主体的计算舆论研究所占比例最高,分别占比71.0%64.5%(允许多选)。前者侧重分析舆论讨论的主题内容或情感,后者则聚焦分析舆论表达中的人类、机构或机器人账户(如考察主体构成及其属性、网络结构等)。探讨个体如何接触或消费网上舆论内容的受众特征和用户画像研究也占据一定比重(11.5%)。而效果研究方面的计算舆论研究相对较少,占比10.0%,主要表现为对“议程设置”、“沉默的螺旋”等经典效果理论在数字平台的检验与发展。聚焦于媒介渠道或平台特性对舆论影响的研究数量占比最少(仅占6.5%),但体现出研究者开始关注技术架构对舆论的影响,如从媒介可供性的视角研究推文长度限制与内容文明程度的相关性3。在所有的计算舆论研究中,超过一半的研究同时涉及两种及以上的研究内容(有113篇,占比56.5%)。其中,78.7%的文献(有89篇)在传播主体和内容之间建立关联分析。

2 计算舆论研究的具体主题分布与示例

四是在舆论重点方面,正如舆论概念主要强调“意见”的表达,大部分的计算舆论研究以舆论表达主体的态度、意见、观点或信念作为主要考察对象(占比66.0%)(允许多选),如分析对假新闻、人口贩卖、反疫苗、Me Too运动等的看法;其次是以认知和事实性信息为舆论考察重点(占比27.5%),如研究政治知识、感知议程等不涉及价值判断的内容;以情感、情绪为考察重点的计算舆论研究位居第三(占比24.5%);而以投票、做志愿者、捐款、游行、在线签名、拉黑等舆论行为为考察重点的研究占比最少(占比5.0%)。

为更具体地勾勒计算舆论研究的具体主题,本研究基于200篇文献摘要进行LDA主题模型分析。首先,我们拟合了2-40的话题模型,通过综合比较混乱度(perplexity)和一致性(coherence)初步筛选备选模型。计算结果显示,随着话题数的增加,模型混乱度总体上持续下降,当话题数等于29时,模型的一致性达到峰值,且混乱度的变化幅度相对较小,因此决定采取话题数为29的模型。在此基础上,人工检视发现机器无监督学习出的类别之间存在较大的重合度,为进一步精简、凝练主题,我们通过人工归并得到12个语义清晰的主题聚类。(见表2)其中位居前三的是:基于社交媒体的社会运动或集体行动舆论(占比27.0%);大选、总统辩论和政党政治的社交舆论(占比19.0%);网络舆论中的议程设置和框架分析(12.0%);随后依次是政治与社会议题的讨论网络及其结构(占比8.0%),假新闻、宣传操纵与社交机器人(占比7.0%),舆论中的信息分享与扩散(占比6.5%),舆论中的情感分析(占比5.5%),技术偏向、平台可供性与公共讨论(占比5.5%),舆论演化机制与动力学建模(占比3.0%),视觉舆论内容分析(占比3.0%),选择性接触与政治意识形态(占比2.0%)以及舆论过程中的信源关系(占比1.5%)。其中,除了前三大主题一直是计算舆论研究的重点外,近年来上升较为明显的主题主要是“假新闻、宣传操纵与社交机器人”以及“技术偏向、平台可供性与公共讨论”。

四、计算舆论研究的理论概念

200篇计算舆论研究中,研究者从传播学、政治学、认知心理学、群体动力学、情感社会学、修辞学、网络科学等多个理论视角出发,围绕公民参与(civic engagement)、社会运动(social movement)、虚假信息(disinformation)和错误信息(misinformation)等舆论核心理论与概念进行分析。基于对文章关键词的统计梳理,我们提取出计算舆论研究的主要理论概念(详见表3),发现以下特点:

第一,4个理论概念出现10次以上,分别是:行动主义(activism)、框架(framing)、选择性接触(selective exposure)和社会运动(social movement),说明它们是研究者最为关注的理论概念,同时也与前述“基于社交媒体的社会运动或集体行动舆论”是最常出现的计算舆论研究的主题吻合。与此相关,连接性行动(connective action)、集体身份(collective identity)、社会身份(social identity)、集体行动(collectiveaction)等理论概念在计算舆论研究中也占一定比重,共同指向特定社会事件或社会运动的线上动员、抗议等舆论研究,关注社会运动中的连接性机制,重视个体共享的文化身份或群体立场对于舆论的形塑影响。

第二,公共领域(public sphere)、极化(polarization)、虚假信息(disinformation)、同质性(homophily)等理论概念也在文献中占据较高比重(出现6-8次)。结合文献阅读发现,这4个理论概念经常同时存在于一篇文献中,存在密切联系。BalcellsPadró-Solanet认为,从早期重点关注封闭虚拟社区,到关注党派传播的错误信息和宣传内容,再到如今探索网络交流是否会加剧社会的极化、操纵和分裂,越来越多学者开始关注数字公共领域退化的风险4。“极化”“同质性”等相关理论概念代表这种退化的具体表现和机制,即认为网络舆论不仅未必能实现不同社会群体的沟通与交流,而且可能带来偏狭与圈层化趋势。

第三,经典理论概念依然在计算舆论研究中扮演重要角色,如“意见领袖”(opinion leadership)、“议程设置”(agenda setting)、“扩散”(diffusion)、“两级流动”(two-step flow)、“把关”(gatekeeping)、“沉默的螺旋”(the spiral of silence)等,在社交媒体等新媒体场景下重新被检验和发展。例如,MerazPapacharissi在框架理论和把关理论的基础上结合网络思维提出“网络化框架”(networked framing)和“网络化把关”(networked gatekeeping)两个新的学术概念5,对传统框架和把关理论进行了概念更新。

3 计算舆论研究的主要理论概念

第四,相对于传统舆论研究,两个相对较新的概念在计算舆论研究中的地位值得重视。其中之一是“情绪”(emotion)(在关键词中出现7次),即研究者注重将“非理性因素”视为影响舆论的重要组成部分,相关概念还包括“情感经济”(affective economy)、“情感公众”(affective public)、“情感同质性”(affective homogeneity)等。另一个是“可供性”(affordance)(出现4次),意味着舆论研究者已经开始关注新媒体尤其是社交媒体技术架构对舆论的影响,使得技术和物质性维度成为理解新媒体舆论的一个新视角,这也反映了传播学近年来高度重视媒介研究的趋势和特色。

五、计算舆论研究的研究设计与方法

01

研究设计:目标、时空与平台

首先,统计显示,相比描述性研究,解释性研究(有127篇,占比63.5%)占比更大,意味着研究者更倾向于采用计算方法识别和估计舆论相关的概念关系和因果效应,而不仅仅停留于对现象的简单计算描述。

如笔者所言,聚焦舆论过程和动态演化是计算社会科学方法的一大优势6。反映到计算舆论研究的时间性设计上,我们发现:聚焦单一时间点的“静态”研究与涉及舆论演化的跨时间“动态”研究数量几乎各占一半(48.0%vs.52.0%)。在104篇涉及舆论演化的研究中,研究者主要采用两种方式刻画演变过程:一是描述性角度,采用条形图、折线图等手段,对舆论有关语料、帖子数量、参与人数、转评赞数等进行随时间变化的纵向描述统计,但并未进行解释性分析;二是解释性角度,建立系统的时间序列模型,将动态的时间次序作为影响舆论的重要变量7

在研究对象所在的空间场景方面,多聚焦于单一国家或社会(占比80.0%);其次是提到多个明确国家或社会的跨国舆论研究(占比9.0%)——如考察阿拉伯世界的女权运动8,以及没有提到明确国家的泛国家地域(占比9.0%)——如研究Instagram上抑郁情绪相关的公共讨论9,另有2.0%的研究场景为虚拟的仿真社会。在具体国别上,尽管计算舆论研究的文献共包括了35个不同国家或地区,来自美国的研究依然在其中(具有明确国家或社会的177篇文献中)并占据重要地位(63篇,占比35.6%),随后依次是英国(15篇,占比8.5%)、德国(15篇,占比8.5%)、中国(12篇,占比6.8%)、意大利(10篇,占比5.6%)、西班牙(10篇,占比5.6%)、韩国(8篇,占比4.5%)等。

涉及中国的计算舆论研究主要关注以下方面内容:一是微博等社交平台上的舆论内容,如微博上的“女司机”性别话语,“Me Too”运动讨论框架等;二是信息扩散与在线互动结构,如业主协会的微博关注网络,微博平台“脏话”的传播过程,天涯论坛回帖讨论的同质性和异质性互动模式等;三是平台算法和物质特性对舆论的影响,如微博热搜推荐算法机制的自然实验,百度搜索行为作为舆论的新窗口等。由此可见,中国主题的计算舆论研究触及中国本土的特色内容和平台,更回应了国际舆论研究的普遍性理论问题和学术概念(如网络同质性、意见极化等)。

就研究媒介与平台而言,大多数研究聚焦于单一平台(占比86.5%),少数(27篇,占比13.5%)是关于舆论的跨平台研究。在跨平台研究中,主要以传统媒体和网络舆论的比较分析为主,如比较BBC等传统媒体、Buzzfeed等数字原生新闻网站以及推特等社交平台三种不同类型媒介的政治议程设置10。在具体平台方面(可多选),接近2/3的计算舆论研究聚焦推特、微博等基于单向关注的社交平台(占比65.0%),随后依次是传统媒体、实验平台、仿真环境等其他平台(占比12.5%)、门户或新闻网站及其评论(占比7.5%)、在线论坛/社区BBS(占比6.5%)、博客(占比5.0%),其次是脸书、微信等基于双向关注的社交平台(占比19.0%),而以视频网站和搜索引擎为平台的研究相对最少(占比分别为3.5%3.0%)。

02

研究方法:数据采集与分析

计算舆论研究中的计算方法可以运用于数据采集和分析的不同阶段。从数据采集和生成的性质角度,可分为两种类型——计算方法和传统方法,前者指通过文本挖掘、在线实验、用户挖掘、ABM仿真以及在线档案等机器方法采集、生成非人力可及的海量数据,后者则指通过人工方式(如调查、实验或内容分析)得到规模有限的数据。值得注意的是,有部分研究会采用计算方法抓取海量数据,但在处理(生成)数据时又回到传统方法(如人工编码),也有个别研究,只在数据分析阶段使用计算方法,而数据采集/生成则来自传统方法。

统计显示,在200篇计算舆论研究的文献中,有2篇采用传统方法采集和生成数据,有29篇尽管采取了编程手段抓取数据但在数据处理时仍回到了传统方法(如内容分析),其余大多数文献(占比84.5%)采取计算方法采集和生成数据。其中,占比最高的数据采集/生成方法为文本挖掘(占比73.0%)(可多选),随后依次是聚焦用户行为记录的在线实验(占比5.0%)、用户挖掘(占比4.0%)、ABM仿真(占比3.0%)以及在线档案(占比2.5%)方法。

4 计算舆论研究的数据采集与生成方法

计算舆论研究的数据来源方面,绝大多数(有188篇,占比94.0%)的研究都使用了一手数据,少数研究(有15篇,占比7.5%)使用了既有的二手数据(可多选),如威斯康星大学麦迪逊分校社会媒体与民主(SMAD)研究小组收集的推特数据集、哈佛大学与MIT合作的“媒介云”(Media Cloud)数据集等。

在数据类型上,大多数研究使用单一的大数据(有143篇,占比71.5%),其余的有57篇(占比28.5%)的计算舆论研究结合大数据和小数据两种不同的数据类型进行分析。在小数据的来源上,研究者多使用通过问卷调查法得到小数据样本(有25篇,占比43.9%),如Cardenal等人结合网络追踪数据和调查数据分析Facebook的新闻推荐如何影响个人议程11I1;小数据的第二大来源是现有的统计数据(占比21.1%)和通过内容分析法得到的数据(占比21.1%),前者如考察网络焦虑分布和出生率、离婚率等社会人口统计数据的相关性11I2,后者如报纸文章数据与社交媒体数据的比较分析11I3;另有9篇(占比15.8%)研究结合采用了质化数据(如采集访谈资料);Van der Meer对危机期间公共框架建构的研究则是唯一一例结合传统实验法获取小数据的研究(占比1.75%)11I4

虽然计算方法采集大数据,但大数据多大程度上具有代表性呢?本研究特别关注了计算方法所采集数据的随机性情况。首先,“时间抽样”是计算舆论研究对文本内容进行抽样的一个重要维度,除了在线实验等研究没有对舆论文本进行“时间抽样”因此不适用外(占比10.5%),大部分研究(占比71.0%)在“时间抽样”方面采取非随机抽样方法,只选取舆论的高峰或爆发期的数据进行分析,仅有少数研究(占比18.5%)获取了舆论发生全部时间的完整数据。其次,在文本数据采集的媒介平台方面,除9.0%%未涉及外,超过半数研究采用非随机抽样方法(占比52.5%),即虽然理论宣称为社交媒体或新闻媒体,但只以脸书、推特或某新闻网站为典型个案进行研究,其余(占比38.5%)明确说明是针对某一具体平台进行的计算研究。再次,在具体的文本抽样上,除11.5%不适用外,超过半数的研究通过设定关键词或标签(hashtag)的方法进行抽样(占比52.5%),仅有少量研究(占比14.0%)使用了特定平台或账号的全量文本作为研究数据,而另有一部分研究(占比22.0%)采用了非全量、也非关键词选择数据的其他非随机方法(如仅采集脸书个别主页下的部分帖子)。

计算舆论研究中用于分析的数据形态以文本内容数据为最多(占比88.0%),其次是点赞、转发、评论等源于用户行为但在前台可见的文本数据(占比47.0%),第三类是以用户性别、地理位置、用户名及其他个人资料等为代表的用户属性数据(占比24.5%)。相比之下,通过服务器或后台获取的不可见的用户行为数据(占比7.0%)、

数据(占比4.5%)、音视频数据(占比3.5%)以及其他形态的数据(如URLABM仿真模拟生成的数据等)(占比13.0%)占比较少。

5  计算舆论研究的数据分析方法

在数据分析方法上,绝大部分的研究都包括对舆论现象的描述性统计(有190篇,占比95.0%),相关或回归分析(占比39.5%)、比较统计分析(如卡方和t检验)(占比31.0%)等经典统计方法在计算舆论研究中同样占据较大比重。除此之外,时间序列分析(占比7.0%)、多层模型(占比4.0%)和结构方程模型(占比3.5%)等进阶统计方法也得到一定程度的应用。文本挖掘方面,各主要方法的使用较为均衡,其中情感分析比重最大(占比12.5%),其次是主题模型分析(占比9.5%),其他文本挖掘方法,如词频分析(占比7.5%)、语义网络分析(占比6.0%)和支持向量机/RNN等机器/深度学习方法(占比6.0%)也占据一定比重。总的来看,采用词嵌入模型等新的技术分析文本的研究还不多。用户挖掘方法层面,社会网络分析方法得到最多的使用(占比35.0%),用以分析舆论的传播结构、寻找意见领袖、侦测舆论社群等;采用非社会网络的聚类分析法的研究仅占1.5%。此外,空间分析(占比1.5%)、图像识别(占比1.0%)等计算方法在计算舆论中也得到少量应用。另外,还有超三成的研究(占比33.5%)混合采用了话语分析、访谈分析和数字民族志等质化分析方法。

最后,在数据采集和分析工具方面,相比于采集工具(占比28.5%),更多的研究未明确汇报数据的分析工具(占比40.0%)。在明确汇报工具名称的研究中(可多选),采集方面,通常被认为主要的编程工具的PythonR的使用占比其实并不高(分别为7.5%6.5%),超过半数(60.5%)研究使用了Node XLDiscover TextCrimson Hexagon等其他采集工具;分析方面,R的使用比例有显著提升(占比22.5%),但GephiWord StatNode XLUCINET等多元工具软件也得到广泛应用(38.0%)。

六、结论与思考

本文通过对国际上12本代表性SSCI期刊200篇文献的内容分析,对国际计算舆论研究的进展进行了具体分析,我们的核心发现如下:

第一,从数量上看,计算舆论研究在2011年以来得到快速发展,《信息、传播与社会》(ICS)、《新媒体与社会》(NMS)等新媒体期刊是计算舆论研究发表的主要园地;第二,研究主题方面,以政治议题为中心,聚焦单一事件,侧重舆论内容和表达主体,对舆论的概念化集中于态度、意见、观点或信念,聚焦“基于社交媒体的社会运动或集体行动舆论”“大选、总统辩论和政党政治的社交舆论”“网络舆论中的议程设置和框架分析”等核心议题;第三,计算舆论研究的理论概念集中于行动主义和社会运动,反思数字公共领域及虚假信息、极化等问题,重新检验框架、议程设置、扩散、把关、沉默的螺旋等经典概念以及关注情绪、可供性等新兴概念;第四,在研究设计和方法上,以解释性研究目标为主,动态舆论研究获得与静态研究同等的比重,但聚焦单一国家/社会以及单一媒介平台的研究仍占多数,文本挖掘是最主要的数据采集与生成方式,大多数研究采用单一的大数据(只有不足三成的研究中同时包含小数据),经典统计、文本挖掘与网络分析是主要的数据分析方法,编程软件和工具使用则颇为多元。

基于上述发现,我们认为计算舆论研究的未来发展应以理论化为核心,在跨事件/议题、跨国家/社会、跨时间、跨平台、跨模态以及跨方法/数据方面作出更多探索和创新。

第一,理论化。舆论研究无疑有着重要的社会应用与治理价值,这也常被强调,但真正有价值的社会应用与治理服务必须以坚实的理论发展为基础。从本研究发现看,尽管有部分新的理论概念开始受到关注,但计算舆论研究的主体仍然集中于社会运动、公共领域以及经典传播过程与效果理论,新的发展与突破尚不多。计算舆论研究的深入发展必须超越简单的方法应用与“炫技”,而应重点致力于推动舆论理论的发展。计算舆论研究应该有更明确的理论化追求。这也可以通过本文下面提出的若干个“跨越”来促进。

第二,跨事件/议题。本研究发现目前的计算舆论研究仍聚焦于单一事件/议题,特别是存在明显的“单一事件”偏向。但一则单一事件的发现无法代表普适的理论规律,二则客观经验世界中特定舆论事件背后总是存在更具基础性的议题,而不同事件/议题之间又总是存在相互影响与勾连。因此我们呼吁,计算舆论研究应该加强跨事件/议题的比较研究,在不同类型事件/议题的比较与关联分析中力求提炼和发展舆论理论。

第三,跨国家/社会。尽管理论上诸多社交媒体平台无远弗届,具有鲜明的跨国性,但目前的计算舆论研究仍然囿限于单一国家/社会,跨国家/社会的比较与关联研究亟待加强。一方面,我们可以通过采集推特(Twitter)、脸书(Facebook)、油管(You Tube)等国际性社交平台上的舆论数据展开比较研究,归纳舆论规律;另一方面,对特定地方的舆论经验也只有在国际比较视野中才能获得深层理解与把握。

第四,跨时间。基于动态演化的舆论过程研究是计算方法带来的福音,这也被本研究的发现证实。跨时间的计算舆论研究已经展现出可喜的迹象,值得大力发扬。目前的跨时间研究以描述性展示动态变化为主,具有理论导向的解释性跨时间计算舆论研究还有待加强。增强时间变量的概念化,拓展时间的测量方式,引入更多元的时间序列分析方法,将跨时间与舆论的跨层次演化机制结合,都是推动动态过程式的舆论研究理论发展的重要路径。

第五,跨平台。目前的计算舆论研究聚焦单一平台,跨平台研究亟待开展。一方面,随着媒介理论的发展,关于媒介技术架构与物质性如何影响舆论的问题,其实代表着舆论理论发展的一个潜力巨大的方向,值得高度关注与继续推进;另一方面,舆论本身就是在媒介平台之间流动、扩散、演化,只有在多元平台整合的视域下理解舆论,才能形成对数字舆论发展的科学总结。

第六,跨模态。本研究发现,目前计算舆论研究的数据仍偏向文本,但在视觉时代,

、音频、视频等正在成为舆论表达的重要形态,未来的“元宇宙”更会将人类的舆论形态推向新的多元体验,这方面的研究需要得到进一步重视。随着计算机视觉技术等的发展,超越文本的跨模态舆论研究可望获得更大发展,其与跨平台研究的结合也带来新的想象空间。

第七,跨方法/数据。一方面,在计算方法内部,文本挖掘、在线实验、用户挖掘、ABM仿真、在线档案等方法各具优势,亟待相互整合,这是舆论研究作为一个跨越个人微观心理、中观群体互动以及宏观社会结构的跨层次理论领域发展的内在要求;另一方面,目前结合大小数据的整合研究还不多见,而大数据不代表数字时代舆论现象的全部,无论是基于传统媒体的内容分析,还是基于随机抽样的社会调查以及客观存在的社会指标,乃至反映深层心理的质化数据,对全面、立体地理解舆论都至关重要,多元方法、大小数据的整合既可以校验网络舆论的“代表性”,更可以理解不同场域舆论的交往互动,这应当成为计算舆论研究的重要发展方向。

文献来源

《新闻与写作》2023年第2

转自:“再建巴别塔”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com