投稿问答最小化  关闭

万维书刊APP下载

青记独家丨复杂适应系统:智媒进化中的数据思维和数据能力

2022/10/28 17:47:08  阅读:161 发布者:

 

  伴随人工智能、区块链、大数据等新兴技术发展,媒体智能化探索受到广泛关注。本文认为,应洞悉“后真相”时代的生态特质,对复杂系统中以识别为核心的数据思维、数据能力予以高度重视。

媒体智能化进程近年来得到广泛关注。媒体以物联网、大数据、人工智能等技术为基础,通过策、采、编、发全流程的智能化,实现了新闻信息的智能生产分发,为用户提供高效信息服务、呈现新型媒体形态。其中,数字化是重要的融合转型抓手和基础。

2022622日召开的中央全面深化改革委员会第二十六次会议提出,加快构建数据基础制度。专家认为,其深意是以制度体系建设的方式推动中国数据交易市场的规范化发展。数字经济时代,数据已经和土地、劳动力、资本、技术并列为五大生产要素之一。深改委会议提出,数据是数字化、网络化、智能化的基础。[1]

数字化时代,媒体获取信源的渠道、手段、技术发生了根本改变。数据真伪莫辨、良莠不齐,谣言、误传和片面叙事混杂、令人莫衷一是,为进入“后真相”时代的媒体带来更多挑战。

媒体智能化进程中,具备怎样的数据思维和数据能力,对数据治理和技术伦理的把握程度,决定了媒体战略、组织架构、管理机制以及技术手段的变革方向。本文试就智媒数据思维和数据能力做些探讨。

媒体智能化中的数据思维

(一)理解复杂系统。2021年诺贝尔物理学奖授予以“理解复杂物理系统的开创性贡献”开展复杂性科学研究的三位不同国籍、不同学科的科学家,意味着对世界与生命本质的探究已进入新的认知阶段。过去对社会复杂性不断增加的实证检验一直缺乏足够的分析框架和依据,当下技术和认知科学的进步已具备了对传统洞察方式进行重要改变的条件——这也是媒体变革的基础。

近期有科学家通过全球历史数据库的构建,追溯了35个自然地理区域(natural geographic areas, NGAs)分层样本在过去大约一万年中的社会发展顺序,捕捉世界历史进程中社会政治复杂性演变的原因。并结合进化生物学中对微观进化(即种群内的遗传和表型变化)和宏观进化(即物种水平或以上的变化)的区分,将文化的微观与宏观进化纳入研究框架[2]。“过去10年中各种思想和工具的发展已表明,用一个新的科学体系来理解复杂适应社会系统已有可能。”[3]

复杂性科学以不同领域的复杂系统为研究对象,从系统和整体的角度探索其性质和演化规律,以揭示各种系统的共性及演化规律,并涌现出发展优化系统的方法。对媒体而言,可理解为以数字化方式对包括物理系统、地球系统、社会经济系统、生物系统等在内的复杂关系进行描述与适应。这种适应体现在:媒体分析方式由小数据样本统计为主到趋向更“全”数据;强化对事件“源数据”的获取、挖掘;智能技术与计算建模结合产生新的感知与分析方法;自然科学与人文社会科学领域在研究协同中日益交汇;趋势预判与风险预警成为媒体智库功能的重要组成部分等,它们都将对媒体传统理念、工作方式和生产效率带来很大影响。

就数据角度看,复杂适应系统意味着多源异构生态中社会数据体系与环境数据体系等的多维融合,凭借传统业务模式与技术手段难以深入解释复杂的关系。因此首先要具备系统性构建感知网络的数据思维,并据此决定数据采集的工具与方式。比如,是否借助和如何使用卫星与传感器技术。

对智能媒体来说,感知系统是一切行动的起点和源泉,也是进行数据挖掘、分析和决策应对的依据。在此基础上,非人工采集、机器学习与识别效能的程度体现了媒体智能化的水平。

(二)理解态势感知的含义和价值。复杂系统不是复合系统,不是各子系统之间简单的叠加。在全球化、环境与可持续发展、预防流行性疾病等突发与常态变化的动态系统中,介于离散与连续、静止与混沌、归因与预测的复杂系统分析都将发挥重要作用,也藉此树立媒体不可或缺的行业价值。

以俄乌冲突为例。冲突双方在技术领域的代际性差异首先体现在理念和思维上。有专家指出战争背后的实质是认知域作战。在信息化智能化时代,“人工智能、大数据、脑科学、神经科学等新兴技术手段全要素融合、全流程渗透,为主导认知、推高认知、颠覆认知等提供了强力支撑和广阔空间,正在引发认知域作战的迭代升级和深刻变革。认知域作战是数据知识的武器化叙事,创新技术手段、专业力量、概念战法是认知域作战的关键。认知域作战遵循进攻与防御的基本原则,攻在于突破对方的逻辑、情感、意志等认知防线,防在于建立己方思想、心理、信念等精神免疫系统,具有攻防一体,无形无界的特点。”[4]

事实上,认知域作战不止于此。态势感知理论最早应用在战场上,上世纪90年代被引入了信息安全领域,之后更是扩展到在一定时空范围内的判断与决策。比如感知企业的安全态势及其危险环境并作出预测,就是基于复杂系统建模设计辅助决策的数据融合分析思维。

美国1984年就建立了国防部直属的数据融合联合指挥实验室,其国土安全部于2010年建立了名为爱因斯坦计划的持续监测技术参考框架,通过多个部门间的联动实现态势感知的风险预测。其中包括持续资产评估、态势感知和风险评分参考框架,传感器是框架中四个子系统之一。

事实上,传感器技术被引入新闻和传媒应用领域,是媒体在物联网环境下应对复杂系统的尝试。媒体感知能力下降,信息来源单一、条件参数缺乏,内容滞后和老化,导致报道赖以决策的依据失真,传统的媒体思维和落后的技术理念已很难适应变化多端的当下。

感知智能技术结合资深传媒人经验,将数据思维应用到传媒领域,有助于媒体分析能力的提升,有利于面向复杂系统、高效捕捉异动、风险和机会,为公众揭示表象遮蔽下的真相。

(三)后真相时代的媒体使命。事实与逻辑的结合是真相的基础。“网络新媒体的发展,使得普通民众也能具有新闻事件的传播能力,可这种参与却也让事件的真相变得难以获得。在这种环境下,即使是专业的新闻记者也会受到‘情感高于理性’‘立场高于事实’的影响,使得专业报道越来越稀缺,这样的时代也就是所谓的‘后真相时代’。”[5]事实真相,从来都不是自明的东西。对事实的判断更会涉及多个不同的类型,即哈林所指的共识区(缺乏争议而没有必要)、合理争议区(操作客观性在运作的区域,争议会平衡地得到呈现)、越轨区(媒体无法中立,有偏向性)。[6]

200多年前,亚当·斯密就已经描述了不同群体利己的社会行为对于社会秩序所形成的影响。麦克唐纳在《后真相时代》中指出,洞悉真相的运作模式,才能更有智慧地处理信息,甚至通过改善真相的讲述方式达成目标。他把伪真相归为四类,即:片面真相——大部分陈述是真实的,但没有传达完整的真相;主观真相——可以被改变的“真相”;人造真相——赋予语言灵活性含义的“真相”;未知真相——尚未被证明的“真相”[7]

对于技术研究者来说,“以假乱真”还是“去伪存真”是一个问题。游戏、娱乐、影视、旅游、教育等各行业在视觉交互与虚拟现实“沉浸感”技术投入上的热情正感染着寻求转型升级的传媒业,应引起警惕的恰是媒体对核心技术与趋势判断上的走偏。从媒体角度看,揭示真相、辨识伪饰是社会责任,也是秉持使命。即便我们试图以虚拟仿真或者“扩展现实”(XR)技术寻找领域扩展和新的商业模式,也不能代替媒体在现实世界中对态势感知与数据挖掘能力的提升,不能忽视媒体在数据能力上锲而不舍的追求。

当然,从技术角度说,它或许是一个问题的不同方面,媒体生产过程中前端采集与后端渲染的分野,也可能会在某些场景中带来纠结与冲突。

批判性始终是媒体最根本的价值所在。媒体智能化的本质是数据形式体现的科学实证研究和系统多维的哲学思辨与人文关怀。

媒体智能化中的数据能力

(一)地图意识、工程素养和建模思维。地图意识是传媒人数据思维中的重要本领。老记者往往会说,脑子里要有一张“地图”。在数字化时代,地图是帮我们理解数据和模型之间关系的利器,它是构建时空模型、寻找故事发展轨迹的叙事框架,从历史解读推演未来的逻辑依据之一。

“胡焕庸线”为例。1935年中央大学地理系教授胡焕庸提出了划分我国人口密度的对比线,被海内外学术界称为“胡焕庸线”。该分界线东侧分布着我国96%的人口,西侧只分布着4%的人口。经过半个多世纪的发展,西侧人口只增加了2%,东侧仍居住着94%的人口,且经济依然存在差距。这条决定经济社会发展格局的“胡焕庸线”恰恰与我国夏季风过渡区重合。它也成为城镇化水平的分割线。2014年,当QQ的同时在线用户数突破2亿时,有人发现,从东北到云南的用户依然被划出了一条清晰的边界——一边满是闪烁的在线信号,另一边则沉没于黑暗,一如1935年中央大学教授书桌上手绘描点画出的分布图模样。

这是早期致力于人类社会和地理环境关系的跨界研究,以今天数字化手段和传媒眼光剖析,当可获得多场景、多主题的事实印证,从而更接近于真相。跨学科的研究需要传媒人以数字时代的“地图意识”来建构计算模型。

工程素养是指智媒从业者执行任务时应具有解构目标和细化流程的工程师思维。如果是单元负责人,还需具备组织不同学科或专业团队突破目标的能力。工程素养的另一面是实验精神,即深刻理解使用工具与目标间的关系,重实证、可重复、能核验。传统的媒体人往往只需要考虑采写、编辑、制图等某一个环节或某一项任务,而智能媒体则需要设计从提出概念到构建工程原型,再到模拟应用场景,形成新闻产品的全过程。这是一个将简单问题复杂化、多维化,再将复杂问题简单化,进行更高层次的提炼和归纳的过程。

建模意识或算得上是媒体适应复杂系统的实践创新成果,某种意义上说,具备建模意识是媒体智能化基因的评价参数之一。设计思维、批判性思维和使用数学工具的素养,对于模型建构的质量具有重要的影响,而这恰是传统媒体所不具备的。一个好的模型,不仅能够通俗易懂地阐述事实,还能够解读逻辑推演下形成的真相,更可以有足够的空间包容更广泛的议题、更多维的角度、更多元的见解。当我们在讨论“智能化”时,优秀的适应于复杂系统的模型辅以恰当的感知网络,其结果往往会超出我们的想象,“生长”出更多的假设和可能性来。换言之,社会动力学模型使媒体可以主动介入更多领域或场景的分析,而智能化的感知对于生命系统、社会系统和环境系统进行识别并可作出大量极有价值的预判。

(二)算法、算力、转换与场景能力。智能媒体的竞争力除了体现在“智能”应用——业务与AI技术融合的程度、选用智能产品或设备的比重和商业回报的财务数据等方面,从可持续的角度看核心还是数据能力。

数据能力大致可以分为计算能力、算法能力、资源转换和场景能力。

算力是生产和加工源数据的能力,存储、抽取、清洗素材交付应用,要满足开放场景和实时处理的要求目前代价甚巨,决定了决策效能;

算法是离应用场景最近、将多元数据集按需转化为决策结果的能力,需要理解算力、传输和资源的状况,协同运作满足场景需求。

资源转换是将数据变现的能力,包括产品化、分析力、运营力等。

场景能力则是构建业务运行的模拟框架,进行数据调用、训练、测试和产品体系适配。

以媒体融合生产技术与系统国家重点实验室(以下简称“国重”)生物感知智能应用研究部围绕数据能力提升所研发的“水晶球”源数据产品为例。“源数据”(Source Data)是以数据形式加以表达的新闻源相关信息的初始记录。通过源数据,媒体可多维分析、溯源、辨伪和再造现场,能在设定的时间维度中充分展现新闻事件内涵、洞察事物的变化形态与逻辑。除了传统的信息获取方式,获得源数据最重要的途径就是传感器,通过感知网络、以人工智能的手段察觉人、事、环境变化的能力成为媒体智能化的重要竞争力。

新华社国重“水晶球”源数据产品的特色之一是识别风险、发现机会(见图1)。可以对区域、行业和企业进行深入观测,辅助传媒从业者进行多维度调查分析。即便受特殊环境或疫情影响不能及时抵达现场,也可获得数据分析、提出问题。

1:“水晶球” 源数据感知智能系统

“水晶球”主要通过网格加以统合,基于风险进行穿透分析。对于时空维度的初始分析、溯源、重建、复盘、核验、辨伪,对时空轴某一区间进行数据挖掘和深度分析,进而对既生之态归因、未知之势预测(见图2)。

2:察觉周期扩展视图[8]

其维度包括——

环境感知(物理层面):对全国范围的环境物理空间进行可网格化的区域数据感知,以1公里网格为单元,对多个领域和行业,如环境污染、地质地貌、社会发展变迁、碳中和、城市建筑等的监测。除根据观测需求调用卫星及传感数据外,2021427日,研究部还与北京零重力实验室合作在太原卫星发射中心随长征六号运载火箭成功发射“蓝星球”号遥感卫星。通过特定轨道绕地运行开展遥感信息采集与侦测,可实现对指定区域的异动识别,辅助突发事件或特定环境的多角度报道和溯源分析、真相挖掘。天空地态势感知机器人系统是“源数据”平台的重要组成部分,目前已嵌入苏州日报等融媒体中心感知智能系统。

社会感知(经济社会文化层面):通过互联网数据及社会信息数据为行业、区域发展提供决策辅助,如可实现地区人口趋势的动态捕捉与分析,对人群进行交叉分析。数据类型包括经济运行数据、企业数据、商业数据、教育资源数据、房地产基础及交易数据等8300类数据,5000亿条有效信息。涵盖全国336个城市、2861个区县实时数据,1000项以上指标,2.2亿个数据采集点。以企业调查为例,“水晶球”通过对全国1.2亿家企业的实时观测和多维分析“企业呼吸数据”,捕捉企业成长进程中的真实状态——包括人事、招聘、专利、诉讼、纳税、营收、文案、动态、舆情等满足自然释放、多源、长期、常态和突发情况下的各类碎片、痕迹数据建模,吸取调查记者专业经验和质疑态度,揭示真相、预警风险。

情绪感知(生理/心理层面):关注生理与心理健康与潜在风险,以细颗粒度情感计算与情绪识别技术,与网格单元匹配,在知情、授权、合规基础上,数据类型包括可定制化的多类算法数据,可广泛应用于传播效果评测、人机交互场景等广阔空间。

就数据能力而言,优势并非“拥有”数据的规模和种类,而是模型构建和数据转化的能力。20226月中央深改委会议透露出的一个值得关注的动向是,从之前的数据产权的权属规则转向数据交易的流通规则,数据流通在将来可能成为制度性的突破点。换句话说,数据是数字经济时代的“石油”,要在场景中开采、流动,才能凸显其价值(见图3)。

3:感知元素数据图

(三)组织管理与技术难点。媒体数据能力的实现需要在组织架构和管理机制上得到保障,并根据战略规划对技术研发进行资源配置,以确保数据能力对业务拓展的支撑与协同。科研强调应用转化,实际上是为研发创造最好的实战场景。

新华社国重非常重视产学研协同创新,模式之一是与业界、学界创建场景化的联合实验室。在此基础上形成适应数据化生产的管理机制,从核心技术攻关、数据采集工具选型、感知网络布局、业务流程再造,到数据产品与运营的岗位设置、绩效评价,以及数据合规、数据管理、数据产品交易和孵化数据科技创投等,是媒体建构数据产品矩阵、形成可持续发展的动能所在。

智能媒体竞争归根到底是趋势与技术判断、人才、组织与机制的竞争。而媒体适应复杂系统、塑造数据能力的还需要精准地判断核心与关键共性技术,抓住重点难点,实事求是、踏踏实实地固基础、补短板。

比如数字化转型和提升数据能力涉及的难点,包括复杂系统中人-机器/-环境之间的关系识别问题;媒体适应复杂系统的跨学科研究、场景创意、美学设计问题;技术伦理、数据治理以及人机社会学问题;伦理算法介入的时序先后问题;数据基础设施建设中媒体介入的必要性和相关数据政策与标准制定的问题。

人机融合智能专家、北京邮电大学教授刘伟对人机融合技术的重点与难点做了归纳,同样适用于智能化转型——

1.输入端:客观数据与主观信息/知识之间的相互验证、混序处理;

2.处理过程:基于规则/统计的推理计算过程与基于经验/应变的非公理计算过程之间的有机协同、高效联动;

3.输出端:逻辑决策与直觉决策之间的快慢平衡、分寸拿捏;

4.反馈过程:事实性反馈与价值性反馈之间的混合叠加、内在纠缠;

5.人机混合:态---知与势---感之间的双向通畅、尺度弥聚;

6.测试评价:人智与机智之间的测试指标/评价标准建立动态管理。[9]

此外,多源异构下的多源数据互认与不同标准体系间的转换,不同目标定义下的分析模型适配,都是智能化进程中的关键环节。我们在数据分析建模中既引入新闻调查的分析视角和专业经验,也引入战场态势感知理论与实践成果。

在数据采集环节,最核心的一是识别,一是追踪。识别要基于对象特征或属性进行自动目标识别,现成的模式识别技术是不够的,最终成败取决于感知点的布局、分类和标引的水平。此外,面向一个追踪靶向运用多传感器数据确定位置、速度、属性和身份[10],在密集杂波、密集目标、复杂的信号传播环境等情况下,数据关联、误差配准、航迹关联等都很具有挑战性。在数字化时代,前端数据采集的重要性尚未得到媒体足够的重视,而这恰恰是数据挖掘与分析的基础和前提。

任重道远。媒体发展中遭遇的挑战不断带给我们新的希望与憧憬,对于世界真相的探究和对生命密码的求索,始终是推动媒体人不断前行的动力。

参考文献

[1]中央深改委.关于构建数据基础制度更好发挥数据要素作用的意见[R].2022-06-22.

[2]Turchin,P,Whitehouse,H,Gavrilets,S,Hoyer,D,François,P,Bennett,BS,Benam.Disentangling the evolutionary drivers of social complexity: A comprehensive test ofhypotheses.[J]. MSCIENCE ADVANCES · 24 Jun 2022  · Vol 8, Issue 25.

[3]约翰.H.米勒.复杂适应系统——社会生活计算模型导论[M].上海:上海人民出版社,2012:49-54.

[4]李明海.认知域正成为未来智能化混合战争主战场[N].环球时报,2022-03-17.

[5]吴飞.我们真的来到“后真相时代”了吗?“我们新闻专业主义的义理与困境”[EB/OL].惟新讲坛,https://zhuanlan.zhihu.com/p/837940012020-10-23.

[6]吴飞.对“新闻专业主义”的溯源及反思[EB/OL].腾讯媒体研究院,https://view.inews.qq.com/a/20210407A04MRN00,2021-04-07.

[7]赫克托·麦克唐纳.后真相时代[M].北京:民主与建设出版社,201916-19.

[8]刘熹,赵文栋,徐正芹.战场态势感知与信息融合,北京:清华大学出版社,20191-4.

[9]刘伟.人机融合:超越人工智能[M].北京:清华大学出版社,2021284.

[10]刘熹,赵文栋,徐正芹.战场态势感知与信息融合[M],北京:清华大学出版社,20198-11.

(杨溟:媒体融合生产技术与系统国家重点实验室生物感知智能应用研究部负责人、新华网融媒体未来研究院院长;杨昊:新华网融媒体未来研究院产品总监、新华社国家重点实验室研究员)

【文章刊于《青年记者》2022年第17期】

本文引用格式参考:

杨溟,杨昊.复杂适应系统:智媒进化中的数据思维和数据能力[J].青年记者,2022(17):43-47.

转自:再建巴别塔”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com