投稿问答最小化  关闭

万维书刊APP下载

贾瑞雪|打开“黑箱”:平台社会视野下个人数据收集的结构性特征

2022/10/28 17:39:59  阅读:204 发布者:

内容提要

为了打开数字平台的“黑箱”,探究其个人数据收集的结构性特征和风险,作者以国内用户日常使用较为频繁的应用平台(App形式)为样本,以手机权限机制和应用平台隐私政策文本为数据来源,在宏观的“平台社会”视野下,将个人数据的内容结构表征为三个网络模型。结合社会网络分析发现,安卓系统手机权限机制的“把关人”角色正在弱化,隐私政策的呈现方式难以保障用户充分知情,应用平台易于实现个人数据聚合使用与二次使用。根据结构化理论,个人数据的内容结构是个人数据收集实践不断结构化的中介和结果。这一结构更多地体现了平台企业的“结构性力量”,平台企业数据收集实践的制约性与用户能动性之间呈现出不平衡状态。

关键词

平台社会  个人数据  结构化

应用平台  隐私政策

正文

一、引言

作为数字新媒介,数字平台已成为人们开展各种实践的新场景和新工具,并迅速延伸至衣、食、住、行、工作、学习、娱乐等各个领域。“平台化”作为“媒介化”在新型信息技术与社会环境下呈现出的一种特殊形式或具体表征,使“平台社会”成为对当前“媒介化社会”的精准提炼。平台社会指新型信息技术环境下,人类在各类数字平台中开展社会实践活动、共享社会资源的一种新型信息社会形态,为理解数字平台在整个社会中的建构性作用提供了概念基础和理论视野。与此同时,人类生产、生活实践平台化迁移的直接结果是,作为数据密集型基础设施的数字平台无时无刻不在记录和处理用户的个人数据,并在整个社会层面形成了个人数据的内容结构。在数据成为新型生产要素和基础战略资源的平台社会,人们一边享受着数据增值带来的便捷且个性化的服务体验,一边对个人数据泄露、滥用、非法交易、隐私披露等风险怀有深深的忧虑。个人数据收集作为数据开发、利用的首要环节,形成了怎样的结构性特征和有哪些风险,成为当下较为迫切的议题。

人们常用“黑箱”(black box)来形容一个记录设备,如数据监测系统,或者一个运行机制神秘的系统。数字平台显然构成了一个黑箱,其持续不断地收集用户的个人数据,但是其数据收集机制却不为用户所知。一方面,用户正经历着一种无所不在的“无感伤害”,隐私权已较难保障其数据权益;另一方面,用户既缺乏能力,也不愿投入时间和精力去了解——其哪些个人数据出于何种目的被收集,就整个社会而言个人数据形成了怎样的结构性特征。为了使这一黑箱直观可见,本研究跳出某一个(类)数字平台的微观视野,将个人数据收集置于数字平台相互关联的平台社会的宏观视野下,将结构视角的相关理论引入个人数据研究中:一方面,基于社会网理论,以量化的关系模式对个人数据的内容结构进行网络化表征,探究个人数据收集的结构性特征和风险;另一方面,借鉴结构化理论,揭示个人数据收集的结构化内涵,反思平台企业数据收集实践的制约性与用户能动性之间的关系。

从关注媒介技术对受众态度、认知和行为的影响,到数字媒介的物质性转向,传播学的研究范围不断拓展。就本研究在传播学研究脉络中的位置而言,对数字平台及其数据收集机制的探索,不仅能进一步拓宽数字媒介研究的理论面向,还能够创新隐私和个人数据研究视角,对平台社会的洞察也有助于丰富媒介与社会研究视野。与此同时,本研究的现实意义在于增进人们对自身数据被收集情况的理解程度,为平台社会视野下个人数据治理提供创新性思路,进而助益于数字平台和数据在社会、经济运行中发挥重要作用,并防范相关风险。

二、文献回顾与研究问题

本研究主要从平台与平台社会、个人数据与隐私、个人数据收集机制、结构视角的相关理论基础四方面进行了文献回顾,继而提出研究问题。

(一)从平台到平台社会

“平台”作为媒介化语境下新兴的技术、经济、政治和文化现象,一直是众多学科研究的热点:工程设计领域关注平台“模块化的技术架构”;计算机领域强调平台是“能够再编程的”;经济学领域关注平台的“多边市场性质”;政治经济学领域批判“平台资本主义”。随着传播学界对“媒介”的认识逐渐超越大众传播意义上的媒介,“以前不被视为媒介的对象……由于其数字连接性而成为媒介”,对媒介的研究也逐渐跳出以文本为中心的思路。其中,平台研究作为数字媒介研究的新领域,为传播学带来了新议题和新视角,比如,平台作为媒介的数字化、中介性和可供性,平台算法和平台劳工,平台的连接文化和数据化等。

进入21世纪,卡斯特(Castells)的“网络社会”一直是对信息技术影响下社会形态的精准概括。随着网络基础设施的“平台化”和数字平台的“基础设施化”,数字平台已与新型信息技术融合发展并成为人类生产、生活实践的物质基础,重新组织、架构了社会诸领域。学术界的注意力也逐渐从平台的用户界面和功能转移到其后端数据库的用户数据集成上,从“平台作为事物”转向“平台化作为过程”。在“平台范式”的推动下,网络社会经历了平台化转型,平台社会由此形成。平台社会是不同层面平台化的集合体,诠释了数字平台与社会结构之间不可分割的关系。在这一媒介与社会研究的全新语境与理论视野下,平台研究的想象力被进一步释放。因而,我们不能再孤立地研究某一个(类)平台,亟需将诸多平台视为相互关联的网络,在平台社会视野下开展整体研究。另外,数据收集显然不是某些平台的个别行动,而是整个社会的常规实践,这一视野也为数据流动议题提供了较为精准的语境。

(二)从隐私到个人数据

随着平台化日益深入社会生活,数据的流动性和商品化成为不可回避的现实议题。“个人数据”作为横跨计算机、信息管理和法学等领域的范畴,与“隐私”既相互重合,又互有界分:隐私强调私密性,其价值基础在于人格尊严和人格自由发展,财产价值并不突出,对隐私权的保护主要是消极防御;而个人数据集人格利益与财产利益于一体,强调人际交往过程中个人对自身数据的积极利用与控制,具有自主价值和使用价值。经过“去识别化”或“匿名化”处理后的数据利用问题,以及与此关联的数据资产问题,构成二者的主要差异。

长期以来,传播学一直在“隐私”的范畴内处理“个人数据”这一命题。随着信息技术的发展,隐私权已从最初的“宁居权”演化为“信息自决权”,即便如此,其标准和规范也越来越不适应数字经济快速发展的时代背景,表现出一定的局限性。尤其在数字平台已经迈入到对用户数据原始积累的“非法兴起2.0”阶段。身处平台社会,用户无偿地进行着数字经济原材料(数据)的生产活动,其一切都在被数据化。能够识别自然人的、并不私密和敏感的公开个人数据,虽不受隐私权保护,但是其数据主体的个人数据权益也应得到保障。我国已将“隐私权”和“个人信息保护”并置于《民法典》人格权编下,明确了二者的边界。因此,在数据化逻辑深入社会肌理的当下,传播学的研究焦点亟需从“作为秘密的隐私”转向“作为控制的个人数据”,尤其是平台研究视野下个人数据的实证研究。

(三)个人数据收集机制

个人数据兼具个体属性、商业属性和公共属性,其权利主体多元,基于职权、法律授权或用户授权形成了复杂的权力关系与结构。在这一权力结构中,平台企业需通过制定隐私政策和申请调用设备权限的方式获得用户的“知情同意”后才能收集其个人数据。其中,隐私政策是平台企业消除用户隐私顾虑的重要行业自律措施,也是平台运营的基本资质之一,旨在帮助用户了解平台会收集其哪些个人数据,为什么收集,如何收集、存储、使用和保护等。隐私政策也被视为网站“引诱”网民主动提供其数据的“诱饵”以及发生侵害时的免责声明。权限机制是智能终端操作系统内置的访问控制机制,系统以此来控制应用程序对系统资源和个人数据的访问。

作为个人数据收集和使用的第一道关卡,隐私政策和权限机制一般以三种方式呈现和提示:一是增强式告知,在用户下载安装、注册登录或首次使用某一数字平台时,以默认勾选、手动勾选或不可选择的方式提示并向用户征求同意;二是即时提示,在使用数字平台具体服务的过程中,以提示框方式即时弹出并向用户申请调用相应权限;三是用户主动查询和管理。即使有隐私政策和权限机制作为保障,个人数据收集依旧发生在不对称的权力关系中,对于用户是否被监视、平台企业如何处理收集到的数据,以及基于数据得出的结论将对用户采取哪些行动,用户几乎没有选择权。总之,现有研究多从法理学层面论证个人数据权益的属性、隐私政策与权限机制的合规性,而对“数字平台的哪些功能需求对应哪些个人数据收集”以及“就整个平台社会而言个人数据收集形成了怎样的结构性特征”等基本问题缺乏实证研究。

(四)结构视角的相关理论基础

事物都是由结构组成的,一组特性之所以被称为“结构”,是由于它相对于其他特性而言具有稳定的决定作用。不同结构视角对应着不同理论基础和分析路径,本研究主要基于结构分析的关系传统和文化传统。关系传统主要源于系统论和社会网理论。在系统科学中,“结构”指系统各元素之间相互关系、相互作用的总和,一旦形成,会反过来对元素之间的关系和行为施加约束和限制作用。作为结构的重要形式,网络由节点和连接构成,其核心是关系的集合,其中节点表示系统的元素,节点之间的连接表示元素之间的相互作用。随着社会网理论和社会网络分析法的发展与成熟,用量化的关系模式对社会现象进行网络化表征,已成为主流的研究方法。社会网络作为个人能动性与结构制约性相互作用的接口,能够同时对行动和结构进行检验,是目前结构分析最有力的工具之一。

在文化传统方面,关于结构与个体的关系,现代西方社会理论界具有这样的认识论分野:强调“结构”的各种结构主义和功能主义,关注结构和制约问题;强调“个体”的各种解释学思想传统,关注主体性、行动和意义。吉登斯(Giddens)的结构化理论(structuration theory)抛弃了仅仅从主体或者客体出发研究社会的二元论视角,确立了从人类“社会实践”出发看待社会的研究思路。其核心可提炼为“结构二重性”(duality of structure),结构中的行动与行动中的结构辩证统一地融合在一起,“社会系统的结构性特征对于它们循环反复组织起来的实践来说,既是后者的中介,又是它的结果。”通过实践,社会结构制约性与个人行为自主性之间的互构关系得以实现,结构得以跨越时间与空间被具有自主性、能动性的人类生产与再生产出来,继而反作用于人类实践。

综上所述,本研究将结合社会网理论与结构化理论的结构视角,一方面通过网络模型表征个人数据收集者(由不同功能模块构成的应用平台)与收集内容(个人数据)之间的关系结构,发现个人数据收集的结构性特征和风险;另一方面思辨地看待个人数据内容结构的构成性、实践性和生产性等特征,反思“结构-行动”互构过程中平台企业与用户之间的相互作用关系。

(五)研究问题的提出

RQ 1:应用平台将通过申请调用哪些手机权限类别来收集用户的个人数据,这些应用平台与其会申请调用的手机权限之间形成了怎样的网络结构?

RQ 2:应用平台会收集用户的哪些个人数据,这些应用平台与其会收集的个人数据之间形成了怎样的网络结构?

RQ 3:应用平台将基于哪些功能模块需求收集用户的个人数据,这些功能模块与其需求的个人数据之间形成了怎样的网络结构?

RQ 3a:由于会被同一功能模块收集,个人数据之间会形成怎样的网络结构?

RQ 3b:由于需求相同类别的个人数据,功能模块之间会形成怎样的网络结构?

RQ 4:个人数据的内容结构是如何形成的?

三、研究设计

(一)应用平台样本选取

应用平台和以智能手机为代表的智能终端平台是国内用户日常使用较为频繁的数字平台。截至202112月,我国通过手机接入互联网的网民达10.29亿,占整体网民规模的99.7%,国内市场上监测到的App在架数量达252万款。20206月,15-19岁网民人均手机安装App数量最多,有83个;10岁以下人均手机安装App数量最少,有28个。本研究根据大数据产品“易观千帆”提供的对全网App活跃人数的排名,选取20195月榜单中的Top 80为研究样本,覆盖资讯阅读、社交互动、电商服务、影音娱乐和实用工具五大类应用平台。

(二)编码与数据采集

由于手机操作系统、应用平台及其隐私政策和权限机制始终处于快速迭代状态,本研究的编码与数据采集工作主要集中于201978-2019720日。应用平台作为一种复杂、综合的服务,由多种功能模块和多类个人数据构成,因此本研究首先对“功能模块类型”和“个人数据类别”进行了编码,类目详情见表1。然后,两位编码员根据编码细则同时对80个应用平台的隐私政策文本进行数据采集,并以“应用平台-功能模块-个人数据”三元组的形式记录在Excel中,共计2197条记录。每一行表示某一应用平台将会针对某一特定功能模块收集某一类个人数据一次。在80个应用平台中随机抽取10个共计335条记录(超过5%),以独立编码者检验,krippendorff's=96.7%,具有较高的信度。最后,查询手机中所安装的80个应用平台的权限情况,采集“应用平台-权限”数据并以二元组的形式记录在Excel中,共计814条记录。每一行表示某一应用平台会申请调用某一类手机权限。

(三)数据处理与分析

针对以上采集到的数据,本研究主要进行了隶属网络(affiliation network)分析。隶属网络是一个“2-模网”,用来表示一组行动者与一组事件之间的隶属关系,由行动者集合N={n1n2,…,ng}和事件集合M={m1m2,…,mh}构成,可以表述为:行动者属于某个事件,或者行动者是某个事件的成员。本研究采用“2-模关系矩阵”对三个隶属网络进行标示,操作详情如表2所示。此外,由于行动者和事件之间的关系具有对偶性(duality)——行动者由他们所属的事件彼此关联,同时,事件也由它们的行动者而关联在一起,因此,隶属网络可以从行动者和事件两个视角分别进行研究。也就是说,“2-模关系矩阵”可以转换成两个“1-模关系矩阵”:“共同参与矩阵”XN,记录了每对行动者同在的事件数目;“事件关联矩阵”XM,记录了同在两个事件的行动者数目。本研究将根据研究需要对以上三个“2-模关系矩阵”进行相应的转换。最后,通过社会网络分析工具UCINET对以上所有关系矩阵做进一步分析。

四、研究发现

通过建构网络模型,本研究从三个层次层层递进地分析个人数据的内容结构。

(一)应用平台与其会申请调用的手机权限类别分析

针对RQ 1,由Top 79应用平台构成的“应用平台-权限”隶属网络拓扑结构模型如图1所示。其中,方形节点代表应用平台,共79个;圆形节点代表应用平台会申请调用的手机权限,共21个;两类节点之间共形成了814条连接,网络密度为0.5,表示实际的连接数(814)与理论上最大的连接数(79×21=1659)的比值,说明两类节点较为紧密地连接在一起。节点大小代表了度数中心性,即与节点直接连接的其他节点的个数。手机权限节点的度数中心性等于它所属的应用平台的数目,平均度数中心性为38.8,表示每类手机权限平均会被38.8个(49.1%)应用平台申请调用。如图2所示,几乎所有应用平台都会申请调用手机的存储权限、电话(设备信息)权限、位置信息权限和相机权限。应用平台节点的度数中心性等于它会申请调用手机权限的数目,平均度数中心性为10.3,表示每个应用平台平均会申请调用10.3类(49%)手机权限。360手机卫士(18)、应用宝(17)、腾讯手机管家(17)、百度手机助手(17)、360手机助手(17)、QQ同步助手(16)等实用工具类应用平台会申请调用手机权限的类别数较多。

(二)应用平台与其会收集的个人数据类别分析

针对RQ 2,由Top 80应用平台构成的“应用平台-个人数据”隶属网络拓扑结构模型如图3所示。其中,方形节点代表应用平台,共80个;圆形节点代表应用平台会收集的个人数据类别,共29个;两类节点之间共形成了1162条连接,网络密度为0.5。每类个人数据平均会被40个(50%)应用平台收集,其中,操作和服务日志数据(80)、设备数据(80)、位置数据(79)、手机号码(75)、网络身份标识数据(75)、真实姓名(68)、交流互动数据(60)是大多数应用平台会收集的个人数据类别。每个应用平台平均会收集145类(50%)个人数据,其中,滴滴出行(24)、携程(24)、高德地图(23)、360手机卫士(22)、天猫(21)、酷我音乐(20)、手机淘宝(20)、中国工商银行(20)等会收集较多类个人数据,多为电商服务类应用平台。

(三)应用平台功能模块类型与其需求的个人数据类别分析

1. “功能模块-个人数据”隶属网络分析

针对RQ 3,由Top 80应用平台构成的“功能模块-个人数据”隶属网络拓扑结构模型如图4所示。其中,方形节点代表应用平台的不同功能模块类型,共16个;圆形节点代表为实现不同功能需求应用平台会收集的个人数据类别,共29个;两类节点之间共形成了251条连接,网络密度为0.5。每类个人数据平均会被8.7类(54.4%)功能模块需求,其中,设备数据(16)、照片/视频/录音(15)、位置数据(14)、关系数据(12)、网络身份标识数据(12)、财产数据(11)、操作和服务日志数据(11)、地址(11)、身份证(11)、手机号码(11)、真实姓名(11)等个人数据会被更多功能模块需求。每一类功能模块平均会需求15.7类(54.1%)个人数据,其中,第三方提供的服务(21)、出行服务(20)、金融服务(20)、客服和售后(20)、运行和安全保障(20)、注册登录(19)、其他生活服务(19)、商品购买(18)、身份认证(17)等功能模块需求的个人数据类别较多。

2. “个人数据-个人数据”1-模网络分析

针对RQ 3a,由“功能模块-个人数据”隶属网络转换而来的“个人数据-个人数据”1-模网络共有29个节点,391条连接。由于个人数据的共同参与关系是“有值的”,网络密度等于个人数据成对连接的平均值,为5.0,即每一对个人数据平均会参与5类功能模块的建构。节点的度数中心性表示不同类别个人数据会共同参与功能模块建构的次数。该网络中个人数据节点的平均度数中心性为139.1,最大值为235,最小值为42,其中,设备数据(235)、照片/视频/录音(225)、位置数据(205)、关系数据(194)、地址(192)、手机号码(192)、真实姓名(192)、身份证(192)等个人数据与其他类个人数据共同参与功能模块建构的次数较多。对该网络进行凝聚子群分析,能够帮助我们进一步了解哪些类别的个人数据更有可能聚集在一起。派系(clique)是一种较为严格的凝聚子群概念,是至少包括三个节点、任何两个节点之间彼此邻接、关系紧密的最大完备子群。对于多值网络,首先要确定该子群的凝聚程度,即临界值cc值越大,则子群的凝聚力越强,节点之间的关系强度越大,其所包含的派系被称为“c层派系”。该网络共有411层派系(c=11),见表3,这些派系由所有至少共同参与11类功能模块建构的个人数据类别组成,相互重叠。

3. “功能模块-功能模块”1-模网络分析

针对RQ 3b,由“功能模块-个人数据”隶属网络转换而来的“功能模块-功能模块”1-模网络共有16个节点,120条连接,是一个全连通网络,即任意两个功能模块均会需求同一类个人数据,每一对功能模块平均会需求9.5类个人数据。不同功能模块类型需求同一类个人数据的次数的平均值为141.9,最大值为187,最小值为70。其中,第三方提供的服务(187)、客服和售后(185)、运行和安全保障(183)、出行服务(175)、金融服务(175)、其他生活服务(166)、商品购买(164)等功能模块与其他功能模块需求同一类个人数据的次数较多。该网络共有415层派系(c=15),见表3,这些派系由所有至少共同收集15类个人数据的功能模块组成,相互重叠。

五、研究结论与讨论

本研究主要从手机权限机制的“把关人”角色、隐私政策的呈现方式、个人数据的聚合使用与二次使用,总结了平台社会视野下个人数据收集的结构性特征和风险,并借鉴结构化理论对平台企业与用户之间的不平衡关系进行了反思。

(一)安卓系统手机权限机制的“把关人”角色正在弱化

智能手机的操作系统是控制用户数据收集权限的初始环节,应用平台是收集用户数据的直接载体。安卓系统手机权限机制理想的运行逻辑是,应用平台需要在AndroidManifest.xml配置文件中以明确声明的方式(静态方式),以及在代码运行阶段以请求的方式(动态方式)申请系统权限。然而在实际运行中,由于安卓系统的开放性以及应用商店安全性审核的缺失,应用平台总是能够利用权限机制的固有缺陷超出其功能需求范围收集用户数据。作为应用平台收集用户数据的“把关人”,安卓系统手机权限机制并未充分发挥其保护用户个人数据的作用。

第一,应用平台与其会申请调用的手机权限之间形成了紧密相连的隶属网络。存储权限、电话(设备信息)权限、位置信息权限、相机权限、麦克风权限和通讯录(读取联系人)权限等几乎成为每个应用平台都会获取的“标配”,这意味着对照片/视频/录音、文件数据、设备数据、位置数据和关系数据等个人数据的普遍获取。第二,应用平台强制、过度索取手机权限的现象并不少见。比如,只要用户不同意,应用平台就会持续不断地弹窗申请权限,为了流畅的使用体验,用户只能点击允许,而且权限一旦授予,应用平台就始终拥有该权限,此外还有一些应用平台在安装时就要求用户“一揽子授权”。第三,安卓系统手机权限机制的运行过于依赖用户的判断。为了正常使用应用平台,用户授予权限在某种程度上是一件无法拒绝的事,至于通过这些权限获取的个人数据是否会被用于与初始收集目的无关的其他目的,用户一无所知。针对上述情况,需强化操作系统的隐私设计理念,将数据保护相关的智能程序预先“嵌入技术、商业准则和物理存在的基础设施的设计标准中”,“使其成为系统运行的默认规则”,而无须用户采取过多行动。与此同时,应用商店也要严格审核并对违反操作系统权限要求的应用做下架处理,甚至和企业信用相关联,共同从源头上规范个人数据收集乱象。

(二)隐私政策的呈现方式难以保障用户充分知情

分类与分级是认识世界的一种视角,解释事物的一种方法,也是风险识别的基础,对个人数据进行分类分级保护已成为学界共识。根据使用场景、安全级别、私密程度、敏感程度等维度,均可对个人数据类别进行划分。然而,仅仅对个人数据分类只能呈现静态、孤立的内容,而对个人数据类别与应用平台功能模块类型之间关系的可视化则有助于表征动态、关联的个人数据内容结构。在隐私政策中,相互关联的“功能模块-个人数据”比现行的呈现方式更具治理层面的操作意义。这一细粒度的呈现方式能够同时说明个人数据的类别与用途,不仅更符合用户的认知习惯,而且能在一定程度上缓解用户与平台企业之间的“信息不对称”。

平台的生态系统本质,决定了其会以接入第三方服务的方式全方位拓展其功能,而更多的功能往往意味着更多的数据需求。我们可以将应用平台收集的个人数据概括为三类:一是为实现应用平台基本功能而必须收集的数据,若用户拒绝则无法使用该平台,针对这一类数据的监管,中央网信办、工信部、公安部、市场监管总局联合制定了《常见类型移动互联网应用程序必要个人信息范围规定》;二是为实现应用平台附加功能而选择收集的数据,若用户拒绝则无法达到服务的预期效果;三是为实现应用平台第三方服务而选择收集和共享的数据,第三方遵守其自身的隐私政策,平台只能敦促其为用户数据提供足够的安全保护,并不因其不当使用行为承担法律责任。基于此,“功能模块-个人数据”的呈现方式能够避免将用户置于“照单全收”或“全盘否定”的选择困境中,使用户能够在使用某项功能或服务之前较为清晰地认识到哪些个人数据将会被收集以及用于何种用途,是否有其他备选方案,从而做出更加明智的选择。

虽然我国法律规定了处理个人数据应当遵循“合法、正当、必要和诚信原则”,以及“公开个人信息处理规则,明示处理的目的、方式和范围”。但是,由于隐私政策的形式化、低可读性、告知条款不合规,平台企业的“告知”与用户的“知情”之间存在不小的鸿沟。“告知同意原则”因此被戏谑为:告知不是真正的告知,同意也并非真正的同意。相较于晦涩难懂、冗长繁复的政策文本,平台企业可基于可视化方式,比如“功能模块-个人数据”网络,主动将其收集、使用个人数据的类别和目的明确告知用户,使用户在充分知情的前提下同意授权平台企业处理其个人数据。此外,平台企业目前普遍采用的“一揽子”、“选择退出”模式的同意机制,使得个人数据收集成为“一锤子买卖”,难以保障用户有效同意。因而,基于“功能模块-个人数据”进行个人数据分类分级,以及“构建‘选择退出’+‘选择进入’的可协商式同意模式”,将有利于风险管控前置。

(三)应用平台易于实现个人数据的聚合使用与二次使用

平台是数据连接的载体,相较孤立、单个的数据,只有在网络中的数据才有价值。应用平台中同一功能模块对个人数据需求的多样性,使不同类别个人数据的聚合使用成为一种趋势。应用平台中不同功能模块对个人数据需求的同一性,使个人数据在不同功能模块之间的二次使用成为可能。其中,“聚合”指统计意义上由平台编码定义的用户特征或属性创建新的、更高级别数据实体的计算操作。

个人数据的聚合使用与二次使用同时蕴含着巨大的利益与风险。对于前者而言,同时被一类或多类功能模块需求的个人数据之间建立了连接,这一潜在的连接表明这些个人数据更容易被聚合,从而应用平台可以通过多样化收集和聚合使用实现这些数据的整合价值。但是,由于脱离了社会文化语境,聚合建立了数不清的重数、再结合和重组数据的可能。因此,平台企业要注意个人数据聚合带来的再识别与隐私披露风险,必要时开展个人数据安全影响评估,并基于风险评估采取有效的个人数据保护措施。对于后者而言,共同需求一类或多类个人数据的功能模块之间建立了连接,这一潜在的连接表明,由于数据的非排他性和使用非损耗性,平台企业只需进行一次收集,就可以基于原始数据进行“二次-N次使用”,从而有效降低个人数据重复收集与管理的成本,提高个人数据使用效率并充分挖掘其价值。但是,平台企业也要注意,现行的告知同意原则往往建立在初次使用上,在变更个人数据处理目的、方式前,应重新取得个人数据主体的同意,以免将用户置于失控的、“N次使用”的黑箱风险之中。

(四)平台企业数据收集实践的制约性与用户能动性之间的不平衡关系

借助网络模型的表征,本研究发现,在相互关联的平台社会视野下,除非不使用应用平台服务,否则所有个人数据终将作为“免费使用”的“对价”交与平台企业:不是通过这一类功能模块,就是通过那一类功能模块;不是通过这一个应用平台,就是通过那一个应用平台。而且,个人数据还将在数据开放、共享的背景下高速流转并充分聚合。基于多维度的开放关系,应用平台之间将形成基于后端个人数据流的开放关系网络结构,从而带来个人数据风险范围扩大、个人可识别与再识别出来的风险增加、个人对其数据的控制力削弱等问题。在被各类功能模块需求较多的个人数据中,财产数据、银行卡、个人生物识别数据、行踪轨迹、健康生理数据、征信数据等均属于敏感个人数据,“一旦泄露或者非法使用,容易导致自然人的人格尊严受到侵害或者人身、财产安全受到危害。”而设备数据、操作和服务日志数据等作为用户在线交互的附随产物,即不包含用户劳动要素的“机器生成数据”,虽然无法用来单独识别特定自然人,但往往能和其他数据结合识别特定自然人。这些聚合数据作为个人兴趣、偏好、行为习惯等用户画像的重要来源,甚至能构成新型隐私。而且,国际移动设备标识(IMEI)和媒介访问控制(MAC)地址等手机设备识别码可以唯一识别一部移动设备,一旦该识别码被收集并与用户绑定,用户在该设备上的行为就可以被追踪。

前文已总结了个人数据收集的结构性特征和风险,并简要提出了应对措施,接下来,本研究将借鉴结构化理论进一步反思,以回答RQ 4。个人数据的内容结构是个人数据收集实践不断结构化的中介和结果。参与这一结构化进程的主体主要有平台企业、用户和政府机构,它们分别扮演着个人数据收集者、被收集者和监管者的角色。个人数据的内容结构就是在三者的互动影响下形成的,其结构性特征表明三者的利益并不均衡(本研究主要聚焦于前两者),更多地体现了平台企业的“结构性力量”。在“结构-行动”的互构过程中,平台企业是“规则与资源的结构性占有者”,权力的天平明显偏向它,其通过权限机制、隐私政策、前端用户界面的功能模块、后端数据的自动提取与集成,以及云计算和大数据、人工智能等强大的技术支撑,建构了个人数据的内容结构。而用户的能动性极为有限,面对平台企业建立的数据收集机制,“知情同意”这一看似用户自主选择的背后其实暗含着平台企业“结构性力量”的压制,二者处于极不平衡的状态。虽然前文提到用户可以根据细粒度的“功能模块-个人数据”谨慎地使用相关功能并授予相应数据,然而,平台功能本身就是精心设计和操纵的结果。有研究表明:“社交媒体平台本质上是基于数据的组织,从它们自己设计的社交日常生活中提取价值和利润。”也就是说,即使用户具有一定的能动性,也很难对平台的整体架构施加太多影响。而且,当前的平台权力已不仅仅局限于单个企业,更在于作为一个整体的连接型生态系统的协调和规则制定权力,其重新组织了围绕平台展开的一系列关系。此外,用户对个人数据内容结构的反向建构能力和意愿也极为有限。“个人数据素养”包括数据识别、数据理解、数据反思性、数据使用和数据花招五个领域的能力,这显然不是任何一个普通用户能够轻易具备的。因此,“绝大多数的个体行动对结构影响微乎其微……社会结构制约性与个人行为自主性之间的互构,不是一种平等的互构。”换言之,平台企业的数据收集机制对用户的制约性要远远大于用户对这一机制的能动性。

数字化使人类进入一个“深度媒介化”的阶段。在这一媒介环境中,社会世界的所有元素都与数字媒介及其基础设施密切相关,这些基于软件的、高度互联的数字媒介不再仅仅是交流工具,还可以作为数据生成器,使自动数据处理成为我们社会世界建构的基本组成部分。数字平台作为我们这个时代最典型、价值创造效率最高的数字媒介,正在“使社会生活成为一种开放的、用于提取的资源”,并“围绕数据收集利润最大化实现对人类生命的重构”。随着人类越来越深度地卷入“平台化生存”,方方面面的个人数据将聚合成一个个“数据化的自我”。在平台社会这一“超级全景监狱”中,个人将变得越来越透明,并呈现出客体化倾向。与此同时,平台这一黑箱将变得越来越隐秘,尤其是占有技术、信息、市场等多种资源优势的基础设施平台将形成强大的“私权力”,从而“社会和经济流量越来越多地受到一个由算法和数据驱动的全球在线平台生态系统(绝大多数是企业)的调节”。由此,平台企业与用户之间的商品化关系将形成一种新型控制方式,整个社会像是一面“单向镜”,“重要的企业行动者对我们的日常生活细节有着前所未有的了解,而我们对它们如何利用这些知识影响我们和它们做出的重要决策却几乎一无所知。”“害怕的事情并不是失去隐私本身,而是单向的失去隐私——也就是说,我们无法监视那些监视我们的人。”长此以往,在时空向度上稳定下来的个人数据内容结构将随着例行化的个人数据收集实践不断地被维持并再生产出来,而其中的风险也极易转变为危机。本研究有助于引导人们关注使数据收集、处理成为可能的技术和物质的基础设施,及其背后的政治经济关系。面对平台企业数据收集实践的制约性与用户能动性之间的不平衡,适当干预这一结构化进程,让用户的能动性充分发挥出来,以实现“个人对个人信息保护的利益、信息业者对个人信息利用的利益以及国家管理社会的公共利益之间的平衡”尤为重要。从法律、经济、行政和技术等层面制定的或改良、或激进的用户赋能方案,均可作为走出结构困境的有益尝试。

六、研究局限

第一,本研究按照“功能模块-个人数据”方式对应用平台隐私政策文本中关于个人数据收集的内容进行了编码与采集,但是,某些应用平台的隐私政策并没有完全按照这一方式呈现。而且,隐私政策中的内容不一定符合现实实践情况。未来可考虑采用其他打开黑箱的方法和技术手段进一步丰富数据来源。第二,本研究只选取了国内Top 80App为样本,只考察了安卓系统运行环境,这一个案研究虽然具有一定的代表性,但无法全面反映平台社会视野下个人数据内容结构的复杂性。未来可考虑进一步扩大样本数量,并对比国内外平台的个人数据收集情况。第三,数据分类分级是数据治理的重要议题,本研究从功能维度对个人数据做了类型化分析,未来还应结合敏感性、重要性等维度做进一步分类分级。

载《新闻与传播研究》2022年第7

转自:再建巴别塔”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com