投稿问答最小化  关闭

万维书刊APP下载

宋庆宇等:拥抱数字时代的计算社会学

2023/8/17 18:24:38  阅读:41 发布者:

拥抱数字时代的计算社会学

——评马修·萨尔加尼克的《计算社会学》

摘要:数字技术使得人们收集与分析数据的能力大大提高,也给社会科学带来了新的机遇和挑战。萨尔加尼克的《计算社会学》一书总结了数字时代社会科学的发展,认为数字技术拓展了社会科学研究的想象力与能力,是对传统研究方法的补充,呼吁将传统研究方法与新的研究方法结合起来。不过,萨尔加尼克关于计算社会科学研究方法的讨论忽略了计算模拟的方法。总的来说,萨尔加尼克这本书对于当前处于起步阶段的计算社会科学具有非常重要的指导意义。

关键词:计算社会学 大数据 计算模拟 研究方法

痕迹数据(digital foot)有相当长的历史,正如舍恩伯格与库克耶(2013:5166)所说:“计量和记录一起促成了数据的诞生,它们是数据化最早的根基。”但是,由于记录、存储与分析数据能力的限制,社会科学家一直未对痕迹数据进行深入细致的分析。随着数字技术的飞跃式发展,互联网、智能手机、社交媒体、可穿藏设备等信息技术工具出现,实时地监测每一个社会行为成为现实,越来越丰富的痕迹数据产生了。数字时代不仅为社会科学提供了远观社会的望远镜,也提供了更多的计算分析工具与方法,使得社会科学家的数据分析能力大大提高。

数字时代既给社会科学提供了机遇,例如利用海量的新类型数据研究之前无法回答的问题,也给社会科学提出了挑战,例如:如何处理传统调查研究与大数据研究之间的关系?新的数据类型与研究范式对社会科学研究者提出了哪些新的要求?新的研究设计与数据收集在研究伦理上面临哪些新的挑战?马修·萨尔加尼克(Matthew Salganik)的《计算社会学:数据时代的社会研究》(Bir by Bir:Social Research in the Digital Age)总结了数字时代的社会科学研究,对上述问题进行了回应。萨尔加尼克认为,要将传统研究与新方法研究结合起来,而不是用后者取代前者。

萨尔加尼克的“音乐实验室”

马修·萨尔加尼克目前是美国普林斯顿大学社会学教授,研究兴趣包括社会网络和计算社会学,在《科学》(Science)、《美国科学院院刊》(PNAS)、《社会学方法论》(Sociological Methodology)等期刊发表多篇论文。这部《计算社会学》是迄今为止社会学者针对计算社会学做的为数不多的系统性概述。

小世界网络模型的发现者邓肯·瓦茨(Duncan Watts1998)是萨尔加尼克的博士指导老师。受瓦茨影响,萨尔加尼克很早就关注数字技术和计算方法对社会科学的影响。在博士求学阶段,萨尔加尼克与彼得·多兹(Peter Dodds)、瓦茨等合作开展了一项在线实验研究——“音乐实验室”(MusicLab),成为应用数字技术进行计算社会学研究的经典。萨尔加尼克通过“音乐实验室”的研究,意识到社会科学在数字时代建立新研究范式的可能性。

随着研究的深入,萨尔加尼克(2019:Ⅶ)认识到:“技术的变化,尤其是技术从模拟时代到数字时代的转变,意味着我们可以用新的方式搜集和分析社会数据。”他一直在思索如何利用新的方式开展社会研究,《计算社会学》正是对这一思考结果的总结。在该书中,萨尔加尼克详细介绍了计算社会学的重要研究成果,既包括他自己的相关研究成果,也包括其他学者的研究成果。萨尔加尼克的主要目的是介绍一种新的社会研究范式,因此在书中并没有纠结于具体的技术细节。即便如此,这对于当前处于起步阶段的计算社会科学也是非常及时的。

数字时代社会学研究面临的机遇与挑战

从模拟时代到大数据时代,越来越多的数据积累了起来。萨尔加尼克总结了大数据资源的10个特征——海量性(big)、持续性(alwayson)、不反应性(nonreactive)、不完整性(incomplete)、难以获取(inaccessible)、不具代表性 (nonrepresentative)、飘移(drifting)、算法干扰(algorithmically confounded)、脏数据(dirty)、敏感性(sensitive)。大数据资源并不完美,萨尔加尼克根据大数据与社会研究的关系,将上述特征分为两类,其中前3个特征有利于社会研究,后7个特征不利于社会研究。

萨尔加尼克指出,正是由于大数据资源不完美,因此为了推进社会科学研究的进展,才需要了解新数据资源的特征与优缺点,掌握如何从新的数据资源中获得有用信息。对于社会科学来说,大数据改变我们理解与组建社会的方法,带来思维方式的转变,也给社会科学研究带来了挑战:不仅要面对新的数据源,还要拓展与转换社会科学研究中的想象力与技能(邱泽奇,2018;舍恩伯格、库克耶,2013:129.5166),与对社会行为感兴趣的数据科学家开展合作,以应对当今社会面临的一系列问题。

(一)机遇

萨尔加尼克强调计算社会学所蕴含潜力的同时,并没有一味鼓吹大数据比传统定量数据要好,而是认为不管大数据具有什么特征,其本质上还是数据,是人们社会生活的痕迹(邱泽奇,2018)。作为一种新的数据类型,大数据对调查数据的挑战取决于它对调查数据的替代程度与扩展程度。正如该书中文推荐语所说,“站在数据科学与社会科学十字路口探索计算社会科学的‘美丽新世界’”,数字技术为社会科学研究提供了许多机遇。

第一,大数据意味着“我们已经从一个缺乏行为数据的世界进入一个行为数据极其丰富的世界”(萨尔加尼克,2019:58),有许多数据资源“现成品”。首先,互联网企业产生并积累了大量的行为数据,例如搜索引擎中的日志和社交媒体上的帖子;其次,随着二维码、可穿藏设备、感应器等技术与设备的普及,企业与政府组织积累了越来越多的线下数据,记录人们日常生活的方方面面;最后,政府的行政记录与统计记录等数据的数字化也成为一个重要的大数据来源:丰富的数据资源为研究者解决很多理论问题提供了可能(Farber2015Ansolabehere&Hersh,2012)

第二,日常生活的数据化—社会与个体的日常活动以数字化的形式呈现并存储下来(萨尔加尼克,2019:523)。数字技术与设备已经进入人们日常生活的各个角落,如宋庆宇等(2019)揭示了可穿戴设备实时记录着人们日常活动的地理位置、心率、步数等身体指标,使得现代社会生活的数据化特征盒发明显。技术设备使得“社会之镜”(socioscope)成为现实,可以全方位、高精度地观察社会生活,为科学研究提供了新的领域(彭特南,2015:1119)。

第三,数字设备的互联——移动终端、交易平台、物流网络聚集在一起,形成一个全面监测的环境。数字世界借由其连通性将分散在不同地区的行动者链人网络中,各种数据的汇流让数据具有了社会意义(邱泽奇,2018;邱泽奇、范志英、张樹沁,2015),也为社会研究提供了新可能。例如,实施随机化实验:一方面,人们许多行为都在互联网上进行,因此可以在互联网上持续开展随机对照实验,突破了传统社会科学中实验方法在时间上的约束(RestivoRijt2014);另一方面,通过数字传感器测量和记录,研究者可以在线下实施对研究对象的随机化处理,实现理想社会科学中的实验标准(SalganikDodds Watts2006SchultzNolanCialdini et al.,2007)。另外,连通性也创造了新的交流途径, 让研究人员可以与世界上其他研究者进行大规模协作,开展创新性调查研究,解决以往研究无法解决的问题。

(二)挑战

萨尔加尼克(2019:1015)不仅总结了新技术与新数据带来的机遇,也列出了其带来的挑战:研究人员要全面认识计算社会学的优势与劣势,权衡数字时代社会研究的机会与风险,才能抓住新的发展机会。总的来说,数字时代社会研究面临以下三个方面的挑战:

第一,数据问题。正如上文所言,虽然数字时代的大数据具有海量性等有利于社会研究的特征,但也有许多不利于社会研究的因素。首先,大数据往往掌握在政府与企业手中,社会科学研究者很难获得。社会科学研究者不再像传统模拟时代那样掌握研究设计的主动权,只有与企业、政府等合作,才能接触与分析大数据,失去了对社会研究的主导权(邱泽奇,2018)。其次,数据不易获得与共享。即使研究者与政府和企业合作,但严格的法律、商业机密和伦理也限制了研究人员获取数据。企业尤其将数据视为重要资产,再加上为了规避信息泄露风险,通常不愿意与研究人员合作。即使能够获得数据,但由于数据无法公开与共享,其他研究者也“无法验证和扩展你的研究成果”(萨尔加尼克,2019:36)。最后,数据的代表性问题。根据传统调查标准,计算社会科学处理的数据是非概率便利抽样的结果,未经任何调整的数据可能会得出糟糕的结论,尤其是将研究结果推断到目标整体的时候,这个问题表现得尤为明显。研究者在尝试结合传统数据与大数据提高数据代表性的时候,会遇到数据稀疏、大数据的质量很难评估等问题。此外,由于数据收集中存在用户飘移、算法干扰等现象,大数据往往与社会研究需要之间存在一定距离。

第二,理论研究。萨尔加尼克认为,利用大数据进行描述性研究虽然重要,但更强调理论在大数据研究中的重要性。正如瓦茨(Watts2014)批评社会学一直以来忽视对社会趋势的预测,认为社会科学作为一门科学,其解释必须符合能够预测未来的科学标准(陈云松、吴晓刚、胡安宁等,2020)。但是,计算社会科学在理论解释与预测方面也面临一些挑战:一方面,理论构念操作化的问题依然存在,更多的数据并不意味着构念效度问题迎刃而解,如何更好地对概念进行操作化依然需要讨论与完善;另一方面,计算数据中存在着述行性问题,即“当在线系统的设计者意识到社会理论的存在并将其录入系统的运行方式中时,就会产生更为复杂的算法干扰”(萨尔加尼克,2019:45),数据的干扰性可能是不可见的。当“大数据资源似乎印证了社会理论的预测时,我们必须确保理论本身并没有被纳入系统的运作方式”(萨尔加尼克,2019:44-46)。

第三,道德伦理。在数字时代的社会研究中,研究者面临着艰难的伦理决策,这也是萨尔加尼克在该书中一再强调的主题。技术进步使得研究人员对个体生活的控制日益增强,“在未征得参与者同意,甚至在他们不知情的情况下,对他们做一些事情”(萨尔加尼克,2019:1013),研究能力增强的速度超过了法律法规更新的速度。

总之,在数字时代,对于应当如何使用新的研究能力,目前学界还缺乏共识。造成这种混乱的根源有很多。首先,计算社会科学设有统一的研究伦理。计算社会科学的研究者来源不同,因此有不同的研究伦理,围绕隐私权等有很大分歧。其次,社会文化规范与法律制度的差异。同样的研究设计在有些国家或地区符合法律规定,但在另外一些国家或地区则是违法的,这个困境在全球化时代更加突出。最后,数据的二次使用。“一个数据库是出于某一种目的而建造的······但有一天它也可能被用于一种截然不同的目的”,这会带来意想不到的后果,即使对数据采取匿名化等措施,也很难完全消除数据中存在的风险(Seltzer &Anderson,2008:273-328BarbaroZeller&Hansell2006Zimmer, 2010NarayananHuey&Felten2016:357-385)。

应对之策:对机遇与挑战的回应

社会科学如何迎接数据科学与社会科学交叉—这个“美丽新世界”的机遇?萨尔加尼克(2019:1315)在《计算社会学》中介绍了新研究范式方向,指出计算社会学为传统社会研究带来的变化,“将整合过去我们所做的以及未来将赋予我们的截然不同的能力”,并且回顾、总结了相关的研究。萨尔加尼克并不主张新的研究范式将取代传统社会科学研究范式,而是认为应当“将现成品与定制物结合起来”(萨尔加尼克,2019:1013)。

(一)观察行为

在不干扰研究对象的前提下,观察行为持续运作,收集个体、企业和政府日常活动所产生的副产品—行为数据。对观察得到的数据,计算社会科学可以通过计数、预测和近似实验三个主要研究策略,从中获取有用信息(详情见论文表1):

萨尔加尼克认为,数字时代的观察行为对于社会研究的价值表现在三个方面:第一,检验以往无法验证的理论解释,尤其是相互竞争的理论;第二,大数据的预测能力给决策者提供了更好的评估信息;第三,在不开展实验的前提下进行因果推断。萨尔加尼克强调,“通过仔细积累经验事实、实际模式和难解之题,研究人员可以建立新的理论”(萨尔加尼克,2019:72),扎根理论在数字时代有新的可能性,平衡数据和理论之间的关系。

(二)提问

数字技术不会取代传统社会调查,反而可以将传统调查中的提问方法应用到新的大数据研究中,提升调查数据的价值。萨尔加尼克在回顾抽样调查历史的基础上,发现技术和社会变迁驱动着社会调查研究不断变化。在数字时代,新的社会背景需要社会科学研究者认识到改变调查研究方式的必要性。

首先,利用新技术让传统调查形式多样化。信息技术通过语音会话、短信发送微观调查等方式,可以收集更高质量的数据(SchoberConrad Antoun et. al.,2015)。其次,利用新技术设计新调查、提问方法。相较于传统调查,新技术可以使得研究问题更开放、更有趣、更贴近生活。例如,生态瞬时评估法分解了传统的调查内容,将之融入调查对象的日常生活中,得到只有很高研究价值的高频纵向数据。再次,利用新技术发展与完善非概率抽样调查研究。由于调查技术和社会因素的制约,主流的概率抽样调查的无回答率一直在上升(National Research Council2013),维持高回答率的成本越来越高,无回答现象对研究结果的可靠性产生重大影响。事后分层技术等调查技术使得非概率抽样方法发展到2.0阶段,用更低成本、更快速度来满足调查研究的需要。最后,利用新技术拓展社会研究领域。丰富型提问、扩充型提问等方法将调查数据与大数据结合起来,实现单独通过调查或大数据无法实现的研究目标。当然,萨尔加尼克也指出,新的研究范式并不保证显著降低研究误差。即便如此,社会科学研究者也应当拥抱新的发展趋势,从传统社会研究范式中吸取经验,推动调查提问方法的进一步发展与完善。

(三)开展实验

如上文所说,实验是萨尔加尼克开始其计算社会科学研究的起点。萨尔加尼克十分重视在数字时代开展大规模实验的潜力:互联网能够突破组织实施方面的限制,进行大型群体实验。传统社会研究中,由于社会现象概念的操作化与测量的困难、社会现象的成因复杂以及伦理等原因,社会实验难以执行。因此,社会科学家往往通过观察和调查来收集资料,通过定量或定性分析方法来探索因果关系。但是,受制于数据与分析方法,因果推断没有实现充分的发展(彭玉生,2011;陈云松、吴晓刚、胡安宁等,2020)。

数字时代为“因果推论的唯一可靠方法”的发展创造了可能。萨尔加尼克从“实验室VS实地”“模拟VS数字”两个维度将实验分为四种类型。在纯实验室实验中,数字技术可以精确地测量参与者的行为。例如,已有大量研究者在线招募实验参与者,记录参与者在实验过程中的所有操作行为(Bohannon2016:1263-1264)

数字技术也为实地实验带来了更多可能性,“使研究人员能将实验室实验的严格控制和过程数据与实地实验更加多样化的参与者和更自然的实验环境结合起来”(萨尔加尼克,2019:144),解决传统实验难以解决的问题。对社会科学研究来说,这是最有发展潜力的实验方法。首先,数字实地实验能以零可变成本获得数据,拥有数百万名参与者,大大拓展了实验方法的规模。其次,数字实地实验不间断地记录整个实验过程,获取参与者的背景信息,进行更加高效的实验设计与分析。最后,数字实地实验突破时间限制,实现更长时间跨度的实验设计。此外,数字时代的实验设计在效度、异质性与原理三个方面正在经历从简单实验到丰富实验的突破,为实验方法的发展打开了空间。

萨尔加尼克也介绍了数字时代实验方法的缺点或不足。例如,数字时代的实验方法还是不能进行历史研究,只能评估可操控的处理产生的效果(Banerjcc&Duflo,2009:151-178Dcaton,2010:424-455)

(四)进行大规模协作

“进行大规模协作”指利用微小的努力来进行大规模的科学实验,解决以往似乎不可能解决的问题。万物互联将不同的社会个体连接起来,大规模的科研协作成为可能,更多人参与到研究中,发挥不同人的长处,给社会研究带来帮助(萨尔加尼克,2019:199248)。

大规模协作在天文学(MarshallLintottFletcher2015:247-278)、生态 学(DickinsonZuckerbergBonter2010:149-172)等领域有着丰富而悠久的历史,只是在社会科学研究中很少有研究者使用这种方法。萨尔加尼克认为,在社会科学研究中,大规模协作也有着广阔的未来。大规模协作不仅可以帮助研究者更好地开展研究,还可以节约研究成本。萨尔加尼克根据大规模协作在社会研究中的应用情况,将其大致分为三类:人本计算、公开募集和分布式数据采集。为了推进这个新方法在社会研究中的应用,萨尔加尼克给出了实际操作的五个一般性规则与两个设计建议。

(五)小结

萨尔加尼克指出,新的技术在研究者与研究对象之间建立新的联系,提供新的研究视角与范式,解决社会科学以往难以回答的一些问题。萨尔加尼克主张将新的数据、新的方法与传统社会研究方法结合起来。这是因为,计算社会学研究方法虽然具有速度和成本上的优势,但也存在数据代表性等方面的局限。将这两种研究方法结合起来,能够很好地弥补彼此的不足,发挥数字技术的研究潜力,更好地解决社会问题。

除了介绍社会科学面对新的机遇以及应对的策略,萨尔加尼克还特别指出,社会科学研究的道德伦理问题在数字时代显得更加突出,道德伦理建设具有紧迫性与必要性。建设的现实途径是从已有的道德原则和框架中吸取智慧,结合数字时代社会研究的新特点,形成新研究范式的道德伦理框架。萨尔加尼克重点强调了,计算社会科学有四项基本原则需要遵守:对人的尊重原则、有利化原则、公正原则和对法律与公共利益尊重的原则。然而,在实际研究实践中,将以上四项原则全部落实并不是一件简单的事情,而需要研究者多方面权衡。此外,萨尔加尼克还讨论了在实际研究中计算社会科学遇到的伦理道德特定困难面及具体实用技巧。

计算模拟:被忽略的范式

计算社会科学“不同于以往借助社会调查抽样数据进行描述和经典模型回归分析的定量研究,而是借助复杂模型和社会计算工具对复杂社会现象与过程进行描述、解释和预测的定量社会学新领域”(萨尔加尼克,2019:311315CioffiRevilla2017:17;陈云松,2020)。萨尔加尼克总结了数字时代的社会研究方法,给出了一般性原则。他强调,利用计算科学的现有技术,分析社交媒体等现有数据资源,是一个相对严格的计算社会科学范式(CioffiRevilla2017:120)。因此,萨尔加尼克强调对数据的挖掘与利用,尤其是将研究者自己采集的数据与现成数据结合使用。虽然计算社会学在很多方面改变了传统社会学研究,但是萨尔加尼克的计算社会科学在本质上同传统社会研究仍是一致的,即基于实证的关联性视角,观察数据之间、探求变量之间的关系,依然是一种观察范式,其研究遵循演绎逻辑,只不过新技术拓展了演绎视角的研究范围。

但是,萨尔加尼克关于计算社会科学的讨论忽略了一个重要组成部分计算模拟(simulation)方法(Cioffi-Revilla2017:1-80)。社会模拟能够解决演绎视角下难以解释的社会问题。计算模拟通过计算机系统复制或者再现社会现象,“利用计算机编程灵活模拟行动者的行动与互动,观察可能产生的一系列社会后果,更好地理解人类经济与社会活动中涌现出来的模式及动态”(乔天宇、邱泽奇,2020)。社会模拟是一种生成性(generative)的社会科学研究范式(EpsteinAxtell1996:120),即研究由相互影响的、自适应的行动者(agent)所组成的系统,这些行动者在物理空间或社会结构中占据位置,接受社会环境输入的信息,基于信息与规则展开互动,自下而上涌现出系统层面的结果,如合作等(Cederman2005:864-893Epstein2006:44-49),与传统社会研究中通常所见的观察范式有很大不同。因此,计算模拟是一种自下而上的研究路径,强调模型假设得到结果的普遍性。社会模拟模型可分为不同种类,其中最重要的是根据建模方式将模型分为基于变量的社会模拟和基于研究对象的社会模拟(Cioffi-Revilla2017:1-80;乔天宇、邱泽奇,2020)。

社会模拟研究对于社会科学具有重要意义。首先,社会模拟让社会研究具有更大可行性。社会现象是复杂的,具有高维性、非线性与随机性等特征,观察范式往往无法处理这种高维数据。为了便于处理数据,经常需要假设行动者完全无知,只能进行随机搜索,或者是假设行动者全知全能,不需要探索就能做出决策,这些假设与现实数据存在很大距离。社会模拟则考虑到行动者与社会的多样性,可以设定行动者具有不同的行为规则与策略,并且会产生路径依赖、自组织以及噪音等结果,扩大现有模型的适用范围,使得研究结果更具普遍性(DeMarchi&Page2014:1-20)

其次,观察范式很难解释与预测黑天鹅、灰犀牛等事件。当前社会的连通性、不同个体与部分之间的互动、涌现出的稀少事件会对整个世界产生巨大影响,然而往往缺乏稀少事件的数据,制约了对稀少事件的研究。社会模拟方法通常可以得到复杂的结果,通过时间规模分布等途径,适合于研究极端的事件,提高社会科学的解释能力。

最后,社会模拟能够很好地应对数字时代计算社会科学所面临的伦理道德问题。许多社会研究由于伦理道德等原因,无法在现实社会中进行。社会模拟通常是一个计算机程序,现实中无法实现的研究往往可以在社会模拟系统中进行。基于观测数据与以往研究发现,设定不同假设与行动者策略,可以对社会线性产生过程与机制进行研究(Cioffi-Revilla2017:1-20)。

总之,社会模拟研究具有更好理解复杂世界的潜力,社会研究可以模拟建构更加丰富、多样的行为与社会环境,作为演绎逻辑社会研究方法的重要补充,一起推动社会科学的发展。

总结

数字时代不断产生的痕迹数据,为研究者提供了记录与分析社会现象的机遇与挑战。萨尔加尼克认为当前时代对计算社会科学有许多误解,他希望研究者正视数字社会的趋势,用面向未来的眼光看待刚刚出现的计算社会科学。

随着计算方法进入社会科学研究领域,社会科学正在发生巨大变化。在传统调查、访谈与观察收集“小”数据的时候,社会科学研究者基于模型与理论假设进行统计推论,往往只是对已有研究的检验,而不是发现得出的观点;然而计算社会科学弱化对于理论模型的需要,将更多精力与创造力放在算法与数据上,不仅可以用数据来检验理论假设,还能从数据中发现更多新的内容。另外,计算社会科学的发展也拓展了因果解释可能性,开始强调传统社会科学研究所忽视的预测功能。因此,模型的分析策略也从传统社会研究的偏差最小,发展为减少模型的方差(Evans2020:1)。计算社会科学预测未来发生的事情以及确定影响因素,从而可以为社会政策等的制定提供更多支持,更好地服务于社会现实。

计算社会科学范式也代表了学术群体与社会世界之间新的关系。数字技术的一个重要影响就是改变群体之间的关系,在社会研究中的体现就是学术共同体与政府、企业等社会关系的变化。在传统社会研究中,研究者往往主导数据的收集过程(从研究设计,到数据收集);但是随着信息技术的兴起,无处不在的数字设备以及网络社会的连通性重新建构了社会结构,使得社会研究者对数据的主导权遭到挑战。数字设备可以在人们无察觉的情况下产生“高通量”(high throughput)数据,其获取与存储需要大量的资金与技术支持,企业、政府等组织是这些数据的重要拥有主体。研究者要想利用这些数据,就需要与企业或政府合作,失去了对数据的控制权。

数字技术不仅改变了学术群体与社会世界之间的关系,也改变了学术群体内部的关系。传统社会科学研究者基本来自社会科学领域,随着计算社会科学的出现,计算机等自然科学领域的研究者也开始进入社会研究领域。首先,大数据产生了对分析工具的需要,需要将非结构化的数字信息转变为可以分析的形式。许多计算科学家发明了处理海量数据的模型与分析工具,不仅可以处理文本,还可以处理

、影像等信息。其次,数据革命带来社会分析革命。计算机等领域的学者通过LASSO等分析模型实现了对高维数据的降维分析,用随机森林、深度学习处理数据中的非线性交互作用解释或预测复杂社会现象(Evans2020:1)。因此,正如萨尔加尼克所说,计算社会科学需要促进社会科学家与数据科学家的合作,实现跨地域协作、跨方向交流,甚至是大规模协作等新的科研实践方式(陈云松,2020)。

当前国际学界,计算社会学正在快速发展。对于我国社会科学来说,抓住计算社会科学发展的机遇,是跟上甚至引领国际前沿研究领域的重要契机,对社会科学理论建设、新时代社会主义建设的政策支撑都有重要意义(陈云松、吴晓刚、胡安宁等,2020;罗玮、罗教讲,2015)。在新的社会研究范式形成过程中,中国社会科学界要认识到计算社会学的潜力,拥抱数字时代的影响。为此,需要做到以下几点:

首先,社会科学要以开放的心态接受计算社会学方法(陈云松,2020)。社会科学研究者已经意识到尚处在早期发展阶段的计算社会学存在的问题,但要用乐观积极的态度去推动其更好地发展。这要求社会科学研究者学习和了解计算社会学的范式与研究方法,只备计算社会科学的研究思维。只有这样,才能更好地适应计算社会科学的发展,同时对数字社会有更加深刻的认识。

其次,推动数据的公开与共享。数据是计算社会学发展的重要基础,但是大数据具有难以获取的特征,这制约着计算社会科学的发展。再加上当前我国在数据公开和共享方面发展还比较落后,数据获取的问题显得更加突出。另外,社会科学研究者需要尝试将现有数据与新的大数据资源结合起来,拓宽社会学研究的范围。

最后,关注数字时代的研究伦理:一方面,数字时代的研究者对个体生活的控制与干预能力有了极大提高,因此需要中国社会学界形成数字时代的研究规范和道德准则;另一方面,需要关注与讨论数字时代的隐私等道德问题,引导科技向善。

来源:《智能社会研究》2022年创刊号。作者:宋庆宇 河海大学公共管理学院博士后;乔天宇 北京大学大数据分析与应用技术国家工程实验室博士后;张樹沁 中央财经大学社会与心理学院社会学系副教授。

反思数字民族志:

一个理解“界面”的质性方法

摘要:当代日常文化越来越多地被数字平台所渗透,因此有必要对社会文化现象的观察性研究进行反思。在数字平台时代,仍然局限于物理场所的观察实践面临着各种各样的僵局。结合对工作场所的参与式观察以及对其数字平台的技术漫游(technical walkthrough),本文指出了一种更新界面民族志的案例。一方面,技术漫游法揭示了嵌入在界面中的社会文化假设,以及界面可供性(affordance)产生象征意义的方式。另一方面,参与式观察则侧重强调了实践社区中数字平台的主流观点。基于一项挪威某家软件公司的人类学研究,本文认为,实践社区中的熟练工人以数字平台为导向,因此漫游方法与参与式观察的融合能使研究人员追踪实践社区中固有的双重意义结构。这种融合方法同时也扩展了“数字-实体”连续统中人类学知识的边界。

作者简介:Christian S Ritter, 塔林大学媒体创新与数字文化示范中心

文献来源:Ritter, C. S. (2022). Rethinking digital ethnography: A qualitative approach to understanding interfaces. Qualitative Research, 22(6), 916-932.

本文作者:Christian S Ritter

引言

近年来对基于观察的互联网技术研究的兴趣显著增加,但对数字文化的人类学调查目前还面临着许多挑战,也尚未得到充分的学术关注。形如 SkypeYammerSlackSharePointWhatsApp GitHub的数字平台在过去的十年里,几乎渗透到了企业生活的每个层面,从而极大地影响了全球范围内的商业运作、人际沟通和基于工作的协作。数字平台界面是当代相关活动(task-scape)不可或缺的一部分,在这个范围内,越来越多的专业团体的日常生活交织在一起,这已经改变了无数行业员工的日常工作习惯。事实上,无处不在的数字平台也改变了日常实践可以被观察到的条件,它主要是一个可编程的架构,使得组织企业所有者、程序员和最终用户之间能够交流。其形成的过程也在影响文化内容的生产、分布和流通。一个人人追随社会利益和政治议程的世界跟由日常人工制品组成的技术世界是无法分离的,因为二者在许多当代日常实践中深深交织在一起,这也使当代人类学研究不能仅仅基于合作者们的物理联系。

以往民族志研究的改革要么是空间的重新概念化,进而有多地点的研究设计;要么是对时间的重新想象,进而有多时间线的研究策略,长远来看,很有必要对人类学者使用数字技术有更深入的理解。在讨论对一家挪威软件公司的民族志实地考察的见解上,本文提出了一系列相关问题:当沉浸在数字平台塑造的工作环境中时,民族志研究人员可以采取哪些参与性角色?怎样才能使基于观察的研究借由记录在数字平台界面上发生的日常实践得到充分的改革?最后,基于对上述实际问题的回答,又该如何从参与者观察和演练中获得知识?据此,本文进一步举例说明了在相互连接的数字平台内进行观察性研究的新方法,表明当前民族图表研究的认识论危机可以通过为民族图表研究制作分析界面单元来克服,在这些证据之上可以得出:通过将漫游法与参与观察相结合,研究人员能够追踪从事平台导向劳动的实践社区固有的双重意义结构。这种融合方法拓展了“数字-实体”连续统中人类学知识的范围。

跟踪软件开发者

将人类学研究与数字方法和数据结合起来的新方法学在整个社会科学领域得到了发展,因此,在过去十年中出现了关于数字社会研究背后的认识论和本体论假设的激烈辩论。首先,工作场所人机交互的民族志利用数字和视频数据来阐明那些事关设计和在用工件的实践,为了强调社会科学家和数据科学家之间横向合作的潜力,将人类学和计算机数据结合起来的另一个策略涉及大量数字数据集的质性基础。本文提出了一种新型的界面民族志方法,该方法将物理环境中的参与观察与数字平台提供的分析相结合。虽然以往的许多调查都指出了利用数字数据加强民族志的可能性,但本文的方法展示了平台界面在数字劳动中的积极作用,并揭示了其可供性中的社会文化假设。这种方法将技术漫游集成在一起,从而可以系统地捕获平台界面生成的意义,并且,参与式观察可以阐明给定实践社区的成员如何理解他们的技术实践、社会关系和工件。这两种方法的结合形成了数字中心化和去中心化之间的螺旋动态。

本文的研究对象为一家挪威软件公司,并与他们达成了为期3个月的工作借调协议。除了参加会议和在现场跟踪员工,研究人员还与行业专家进行了30次深度访谈,其中包括来自上述公司的18位专家。研究人员很快就沉浸在公司的办公室文化中,并开始安排与公司不同部门的员工进行跟踪会话(shadowing session)、花时间与员工在他们的办公室交谈,那里气氛更加非正式,有助于鼓励他们慢慢开放和谈论他们与其他员工的个人关系。研究人员还在关键合作者的帮助下获准访问该公司的GitHubSlackHuboard和云计算平台,并在此之后把公司作为一个由系列办公室和系列平台组成的微观世界来研究。然而,尽管研究人员在挪威软件公司的办公室进行了参与式观察,但是这些本地空间与软件开发的社会技术基础结构相互交杂,不过,本文没有将基础结构设想为静态系统,而是在数字平台内界面的原位环境中分析人与技术之间的动态关系。数字技术在物质世界中不断发展,在社会文化产物本身之间以及与人之间产生了复杂的秩序和关系,通过引用Slack平台的示例,本文说明了观察技术如何阐明软件开发者的熟练实践。研究人员随后还对受访者进行了采访,会话跟踪的非正式环境有助于从第一个实地工作阶段过渡到第二个实地工作阶段。

针对Slack平台的技术漫游法

尽管会话跟踪可以为软件开发人员如何解释他们的技术实践提供有价值的见解,但数字平台对传统的基于观察的研究来说是难以捉摸的挑战。本文的实地工作是根据办公室的实际边界划分的,接受调查的员工大部分工作时间都在电脑屏幕前度过。当他们沉默地盯着他们的屏幕时,研究人员意识到只是沉浸在办公室的本地环境中并不能产生对 Slack 足够的洞察力,因此,有必要更仔细地评估这个平台的界面。传统的社会和文化人类学观察方法不再适用,因此本文需要重新思考适用的人类学研究技术,这意味着需要在办公室和会议室去了解雇员经常使用的界面。通过这些观察,数字人类学家可以更好地理解位于界面中的日常实践。本文探讨了如何将基于位置的观察技术与技术漫游提供的面向交互界面的观察结合起来:这种定性方法将网络视为一个数据源,并结合了媒介的方法将科学和技术研究的观点与文化研究相结合。技术预排的一个核心假设是技术和人类相互影响,人类或非人类的参与者可以被分配作为媒介或中介的角色,当中介者在关系网络中被动地传递意义时,他们可以改变自己所承载的意义。通过详细的漫游,研究人员可以了解界面的可提供性能够如何配置参与者之间的关系。可以说,技术漫游法是一个系统的数据收集过程,可以隔离关于调解者塑造界面的日常使用的重要数据,允许研究人员记录平台内符号意义的生成,界面的导航特性,以及关键设置(如菜单、图标和按钮)的安排,从而追踪用户和其他参与者之间的动态相互作用。

本文记录下的关于 Slack 界面使用的数据集包含了各种截图、短视频和大量描述调解者的观察,通过这些观察我了解了软件开发者如何在Slack上协作。例如,Slack 通过内置的管理员特权来配置团队领导者和其他团队成员之间的社会关系,它还能通过集成按钮在 GitHub Slack 之间建立信息流来配置数字基础设施不同组件之间的关联。结合前述的融合方法,这些数据能从不同的角度阐明人类和非人类行为者之间的社会技术动态。

身处混乱的会议

除了Slack平台,还可以通过研究该公司所在地举行的会议来说明参与式观察和技术漫游的结合。这些会议定期围绕着软件开发固有的各种数字平台进行,通过记录它们我能得到对软件开发人员日常工作的洞察,进而指出他们如何给自己的工作赋予意义。例如,引出不同的专业分类,这些分类被员工用来指代内部层级,包括了“ program wareleader(软件领导者)、“ consulent(顾问)和“ produk-teier(产品所有者)。主位知识(emic knowledge)中一个被软件开发者外化的重要组成部分是他们在每天的混乱会议中和混乱会议之后对构建软件产品的分支的理解。这其中永久主分支(permanent master branch)反映了软件的生产准备状态,而子分支(sub-branches)允许软件开发者隔离对软件代码的特定更改,例如错误修复和新特性。

作为参与者和观察员,研究人员可以强烈地感受到当地会议文化所创造的企业内民主环境。通过参加现场会议,还可以了解如何口头评估个人的工作表现,以及这样的讨论如何激发员工的成就感。我进行参与观察的本地空间,如办公室和会议室,揭示了员工如何解释他们的数字劳动以及不同的专业团体参与软件开发的状况。然而,在软件生产过程中无处不在的界面表明,非人类行为者与软件公司的发展也是息息相关。虽然基于位置的观察可以引出关于内部实践、社会关系和工件的基本观点,但是漫游法可以更好地跟踪平台界面的内置中介如何生成符号意义。本文所展示的结合了参与式观察和技术漫游法的界面人类学,可以捕捉到这种发生在专业团体中的双重意义的建设。通过参与式观察和技术漫游的交替,基于平台的劳动分析能够关切到数字的偏心和重心之间的相互作用。

理解“界面”

GitHub 的内置指标在评估挪威软件公司软件开发者的工作绩效方面发挥了重要作用。通过对嵌入在开发人员平台中的中心界面进行技术漫游,本文演示了这种方法如何能够深入了解界面在内部评估中的作用。界面这个词在被创立之初指的是热、光和电通过不同材料的运动,与由物理边界构成的建筑物类似,互联网技术也是通过内部和外部之间的界面进行组织的,我们的日常社交也由各种各样的界面构成,因此有种通俗的称呼是界面是人体和屏幕之间的交互。然而它其实还包括很多非光学的种类,例如键盘、鼠标、传感器和游戏控制器等介于用户和计算机硬件之间的这些接口。

界面首先是计算机的社会技术系统、连接硬件、软件和人类用户之间的共享边界(见图1),而技术漫游是研究人员能够跟踪这些调解实践,并揭示数字劳动的动态,界面人类学也应运而生。它旨在描述行为者交换符号意义的共同边界,并记录调解实践构成的转瞬即逝的地点。因此,界面可以被看作是人类学研究的分析单位。将基于观察的研究引向无缝设计的数字技术的这些内在特征,使研究人员能够揭示数字平台背后的意识形态和编码成数字劳动的隐藏层次结构。

1 用户、软件和硬件之间的界面

开发者平台 GitHub 的界面在被研究的软件开发者的日常生活中扮演着至关重要的角色。GitHub 的大多数成员都是程序员,他们主要使用这个平台来存储计算机代码,其他的用途包括众包、博客和存储法律文件。GitHub还有提供分布式版本控制的功能,这个基于网络的托管服务允许程序员存储和管理源代码。而漫游法则支持对 GitHub 中固有的度量界面进行系统分析,同时跟踪转换中介如何改变通过其界面流动的含义。在访问了 GitHub 上研究公司的私有仓库之后,我可以记录那些塑造了软件开发者日常生活的技术实践。我还编写了关于它们的中央接口的观察记录。通过使用漫游法,我确定了中间人,他们为上面显示的界面的各种支持赋予了意义。软件开发者之间的社会关系根据他们在 GitHub 平台上的成就重新校准,而GitHub 的自动化、内置的度量标准在软件 开发人员的工作绩效和排名文化的内部评估中则发挥着重要作用(见图2)。

2 界面说明了不同的软件开发人员如何为GitHub中的私有存储库做出贡献

参与式观察和技术漫游法为公司内部的工作绩效评估提供了证据。通过在会议上进行参与式观察,我知道了全体会议如何成为一个集体意识形成的民主空间。在这样的会议中,员工可以协商他们的工作表现,解释项目相关决策背后的原因,并表达他们对绩效排名的抵制。然而,漫游的方法提供了洞察界面提供如何调用评估工作表现的方法。这种研究技术揭示了平台界面如何构建成就和竞争力的意识形态。技术漫游法提供了批判社会文化假设的途径,这些假设被编码为平台提供和管理软件开发人员的日常实践。

转自:“量化研究方法”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com