基于位置的社会网络中锚店效应的因果分析;
从短期语言影响预测长期引用;
通过三元合作防御走向稳健的推荐系统;
仇恨言论在社交媒体上的传播;
气候灾害中的能源不平等:管理和灾害引起的停电中社会和空间差异的经验证据;
用于链路预测的线图对比学习;
FocusedCleaner:为基于 GNN 的稳健节点分类清理中毒图;
追随者——分析追随行为的追随者比率类别和用户向量;
寻找社会网络中创新的早期采用者;
探索建成环境与共享单车需求之间的关系:行程长度重要吗?;
航空影像经验观察的多式联运混合微观模型;
Cayley树的雪崩大小分布;
学习网络异构干扰下的个体治疗效果;
Datavoidant:用于解决社交媒体上政治数据空白的人工智能系统;
基于位置的社会网络中锚店效应的因果分析
原文标题: Causal Analysis on the Anchor Store Effect in a Location-based Social Network
地址: http://arxiv.org/abs/2210.13582
作者: Anish K. Vallapuram, Young D. Kwon, Lik-Hang Lee, Fengli Xu, Pan Hui
摘要: 零售经济学中一个特别有趣的现象是主力店(具有知名品牌的特定商店)在客流量方面对非主力店的溢出效应。该领域的先前工作依赖于基于调查的小型数据集,这些数据集通常是机密的或大规模收集的成本很高。此外,很少有作品研究支撑溢出效应的因素之间的潜在因果机制。在这项工作中,我们分析了主力店与非主力店客流量之间的因果关系,并采用倾向得分匹配框架来更有效地研究这种影响。首先,为了展示效果,我们利用了来自 London Datastore 和 Foursquare 等基于位置的社会网络 (LBSN) 的开放和移动数据。然后,我们对位于大伦敦地区的主力店到非主力店(例如非连锁餐厅)的客户访问模式进行了大规模实证分析,作为案例研究。通过研究大伦敦地区的 600 多个社区,我们发现主力店使非主力店的客流量增加了 14.2-26.5%,从而强化了既定的经济理论。此外,我们通过研究混杂因素平衡、剂量差异和匹配框架在合成数据上的性能来评估我们方法的效率。通过这项工作,我们为零售行业的决策者提供了一种更系统的方法来估计锚店效应,并为进一步研究以利用开放数据发现这种效应背后的更复杂的因果关系铺平道路。
从短期语言影响预测长期引用
原文标题: Predicting Long-Term Citations from Short-Term Linguistic Influence
地址: http://arxiv.org/abs/2210.13628
作者: Sandeep Soni, David Bamman, Jacob Eisenstein
摘要: 研究论文影响力的标准衡量标准是它被引用的次数。然而,论文可能被引用的原因有很多,而引用次数只能提供有限的信息来说明一篇论文对后续出版物内容的影响程度。因此,我们提出了一种新方法来量化带时间戳的文档集合中的语言影响。主要有两个步骤:首先,使用上下文嵌入和词频识别词汇和语义变化;其次,通过使用低秩参数矩阵估计高维霍克斯过程,将有关这些变化的信息汇总到每个文档的影响分数中。我们表明,这种语言影响力的测量可以预测 future 的引用:一篇论文发表后两年的语言影响估计与其未来三年的引用次数相关并预测。与包含初始引用计数、主题和词汇特征的预测变量的强基线相比,使用具有增量时间训练/测试拆分的在线评估来证明这一点。
通过三元合作防御走向稳健的推荐系统
原文标题: Towards Robust Recommender Systems via Triple Cooperative Defense
地址: http://arxiv.org/abs/2210.13762
作者: Qingyang Wang, Defu Lian, Chenwang Wu, Enhong Chen
摘要: 推荐系统通常容易受到精心设计的虚假配置文件的影响,从而导致有偏见的推荐。推荐系统的广泛应用使得研究防御攻击成为必要。在现有的防御方法中,基于数据处理的方法不可避免地排除了正常样本,而基于模型的方法难以兼顾泛化和鲁棒性。考虑到上述限制,我们建议整合数据处理和鲁棒模型,并提出一个通用框架,三重合作防御(TCD),通过三个模型的协同训练来协同提高模型的鲁棒性。具体来说,在每一轮训练中,我们依次使用任意两个模型的高置信度预测评分(一致评分)作为剩余模型的辅助训练数据,三个模型协同提高推荐鲁棒性。值得注意的是,TCD增加了伪标签数据而不是删除异常数据,避免了对正常数据的清洗,并且三个模型的协同训练也有利于模型泛化。通过对三个真实世界数据集进行五次中毒攻击的广泛实验,结果表明 TCD 的鲁棒性改进显著优于基线。值得一提的是,TCD 也有利于模型泛化。
仇恨言论在社交媒体上的传播
原文标题: The Virality of Hate Speech on Social Media
地址: http://arxiv.org/abs/2210.13770
作者: Abdurahman Maarouf, Nicolas Pröllochs, Stefan Feuerriegel
摘要: 网络仇恨言论是暴力袭击的罪魁祸首,例如 2018 年匹兹堡犹太教堂枪击事件,从而对弱势群体和整个社会构成重大威胁。然而,关于是什么让社交媒体上的仇恨言论像病毒一样传播开来,人们知之甚少。在本文中,我们收集了 N = 25,219 个 Twitter 级联和 65,946 条转发,并将它们分类为仇恨与正常。然后,我们使用广义线性回归,根据作者和内容变量估计仇恨内容与正常内容的传播差异。因此,我们确定理解释仇恨与正常内容传播差异的重要决定因素。例如,由经过验证的用户创作的仇恨内容比未经验证的仇恨内容更容易传播:来自经过验证的用户的仇恨内容(与正常内容相比)的级联大小大 3.5 倍,长 3.2 倍级联寿命和 1.2 倍的结构病毒性。总而言之,我们对社交媒体上仇恨言论的病毒式传播提供了新颖的见解。
气候灾害中的能源不平等:管理和灾害引起的停电中社会和空间差异的经验证据
原文标题: Energy Inequality in Climate Hazards: Empirical Evidence of Social and Spatial Disparities in Managed and Hazard-Induced Power Outages
地址: http://arxiv.org/abs/2210.13781
作者: Natalie Coleman, Amir Esmalian, Cheng-Chun Lee, Eulises Gonzales, Pranik Koirala, Ali Mostafavi
摘要: 美国的能源部门比以往任何时候都更容易受到极端气候灾害的影响,导致多次灾害引发和管理的停电。据报道,公用事业公司根据停电次数和受影响人口规模优先考虑恢复电力系统。这种方法没有考虑到不平等的影响。对公平基础设施的研究强调,某些人群,例如低收入和少数族裔家庭,受到电力系统中断的不成比例的影响。此外,电力系统的连接网络质量暗示了空间脆弱性的一个因素。然而,关于能源不平等的存在和程度,几乎没有经验证据。一个主要障碍是数据收集过程,因为中断数据通常是易腐烂的,并且无法在精细的空间尺度上找到,无法进行全面分析。认识到这一重要差距,本研究收集并分析了与冬季风暴乌里(2021 年)和伊达飓风(2021 年)相关的观测数据。在冬季风暴乌里的受管停电中,收入较低且西班牙裔家庭较多的人口普查区停电持续时间中位数较高。在飓风 Ida 的灾害引起的停电中,收入较低和黑人家庭较多的邮政编码的停电持续时间中位数较高。如空间基尼系数和基础设施指数分析所示,管理和灾害引起的停电都具有中等程度的空间不平等。研究结果提供了气候灾害期间停电中普遍存在的社会和空间不平等的证据,并强调了将公平纳入公用事业管理人员和应急计划人员恢复停电方式的重要性。
用于链路预测的线图对比学习
原文标题: Line Graph Contrastive Learning for Link Prediction
地址: http://arxiv.org/abs/2210.13795
作者: Zehua Zhang, Shilin Sun, Guixiang Ma, Caiming Zhong
摘要: 链路预测任务旨在预测网络中两个节点的连接。现有工作主要通过节点对相似度测量来预测链接。但是,如果局部结构不满足这样的测量假设,算法的性能将迅速恶化。为了克服这些限制,我们提出了一种线图对比学习(LGCL)方法来获取多视图信息。我们的框架通过以目标节点对为中心的 h-hop 子图采样获得子图视图。将采样的子图转化为折线图后,可以直接获取边嵌入信息,将链路预测任务转化为节点分类任务。然后,不同的图卷积算子从双重角度学习表示。最后,采用对比学习通过最大化互信息来平衡这些观点的子图表示。通过对六个公共数据集的实验,LGCL 在链路预测任务上的表现优于当前的基准,并显示出更好的泛化性能和鲁棒性。
FocusedCleaner:为基于 GNN 的稳健节点分类清理中毒图
原文标题: FocusedCleaner: Sanitizing Poisoned Graphs for Robust GNN-based Node Classification
地址: http://arxiv.org/abs/2210.13815
作者: Yulin Zhu, Liang Tong, Kai Zhou
摘要: 最近,大量的研究注意力都集中在探索 Web 安全上,其中一个最具代表性的课题是图挖掘算法的对抗鲁棒性。特别是,一种广泛部署的对抗性攻击公式是通过修改关系数据来误导图神经网络 (GNN) 预测的图操纵攻击。自然地,人们会问的一个内在问题是我们是否可以准确地识别对图的操作——我们将此问题称为中毒图卫生。在本文中,我们提出了 FocusedCleaner,这是一个中毒图清理框架,由两个模块组成:双层结构学习和受害者节点检测。特别是,结构学习模块将保留攻击过程以稳定地清理图,而检测模块为结构学习提供“焦点” - 一个更窄且更准确的搜索区域。这两个模块将在迭代中运行并相互加强以逐步清理中毒图。大量实验表明,FocusedCleaner 在毒图卫生和提高鲁棒性方面都优于最先进的基线。
追随者——分析追随行为的追随者比率类别和用户向量
原文标题: Follower—Followee Ratio Category and User Vector for Analyzing Following Behavior
地址: http://arxiv.org/abs/2210.13874
作者: Hayato Oshimo, Shiori Hironaka, Mitsuo Yoshida, Kyoji Umemura
摘要: 在许多应用程序中,分析跟随行为很重要。跟随行为可能取决于跟随者的主要意图。用户可以关注他们的朋友,也可以关注名人以理解更多关于他们的信息。从用户的跟随关系很难估计用户的意图。在本文中,我们提出了一种分析以下关系的方法。首先,我们调查了用户之间的相似性。相似的追随者和追随者很可能成为朋友。然而,当追随者和被追随者不相似时,追随者很可能寻求获得更多关于被追随者的信息。其次,我们根据网络结构对用户进行分类。然后,我们提出了基于推文和用户数据估计的用户相似性和类别的后续行为分析。我们通过实验证实了所提方法的可行性。最后,我们检查了不同类别的用户并分析了他们的跟随行为。
寻找社会网络中创新的早期采用者
原文标题: Finding Early Adopters of Innovation in Social Network
地址: http://arxiv.org/abs/2210.13907
作者: Balázs R. Sziklai, Balázs Lengyel
摘要: 社会网络通过同行对采用的影响在创新传播中发挥着重要作用。因此,包括广泛的网络中心性度量在内的网络位置已被用于描述个人采用创新的亲和力及其传播扩散的能力。然而,社会网络在易感性和影响力以及网络中心性方面也是多种多样的。这使得识别影响者变得困难,特别是因为敏感性和中心性并不总是齐头并进。在这里,我们提出了 Top Candidate 算法,一种专家推荐方法,根据个人感知的专业知识对他们进行排名,这与创新者和早期采用者的分类性质非常吻合。利用来自两个在线社会网络的采用数据,这些数据在采用方面是分类的,但代表了网络中心性的不同层次的分类,我们证明了最佳候选排名在刻画早期采用者方面比其他广泛使用的指数更有效。与其他方法突出显示的节点相比,Top Candidate 节点采用更早,并且在创新者、早期采用者和早期多数人中具有更高的影响力。这些结果表明,Top Candidate 方法可以为社会网络上的影响最大化活动识别良好的种子。
探索建成环境与共享单车需求之间的关系:行程长度重要吗?
原文标题: Exploring the relationship between built environment and bike-sharing demand: Does the trip length matter?
地址: http://arxiv.org/abs/2210.13912
作者: Feiyang Wang, Chaoying Yin, Ximing Chang, Der-Horng Lee, Zhengbing He
摘要: 在过去的十年中,共享单车得到了相当多的实践和研究关注。作为一种人力驱动的交通方式,它似乎对行程长度更敏感,因为人们可以骑共享单车去一个步行太远的目的地,或者在去附近的地方时选择它来简单地代替步行。然而,很少有研究关注它,即建成环境对共享单车需求的差异化影响与行程长度。为了填补这一空白,本文从共享单车追踪数据中确定共享单车出行长度的阈值,并采用半参数地理加权泊松回归(SGWPR)模型研究不同长度的建成环境与共享单车需求之间的关系。考虑到关系的异质性。结果表明,建成环境对城市地区的共享单车需求具有异质性影响,并且该影响因出行长度而异。研究结果有助于理解建成环境与共享单车需求之间的关系,并为共享单车的投放提供支持。
航空影像经验观察的多式联运混合微观模型
原文标题: A Hybrid Microscopic Model for Multimodal Traffic with Empirical Observations from Aerial Footage
地址: http://arxiv.org/abs/2210.14022
作者: Georg Anagnostopoulos, Nikolas Geroliminis
摘要: 微观交通流模型可以根据车道纪律的程度区分为基于车道的或无车道的。只有在基于车道的交通中忽略摩托车时,这种区别才成立。在城市中,与高速公路相反,这过于简单化了,更准确地说是混合情况,其中车道纪律可以依赖于模式。经验证据表明,汽车遵循基础设施定义的车道,而摩托车不一定遵守预先定义的规范,可能会参与虚拟车道的自组织形成。这种现象是不同交通参与者争夺有限空间的复杂交互的结果。为了更好地从微观上理解模态交互的动力学,我们首先分析了 pNEUMA 实验获得的详细轨迹的经验数据,并观察了混合交通的模式。然后,我们提出了一种多模式车辆交通的混合模型。混合模型受到行人流文献的启发,具有无碰撞和预期特性,我们证明它能够从航拍镜头中重现经验观察。
Cayley树的雪崩大小分布
原文标题: Avalanche-size distribution of Cayley tree
地址: http://arxiv.org/abs/2210.14078
作者: Amikam Patron (Department of Mathematics, Jerusalem College of Technology, Jerusalem, Israel)
摘要: 网络攻击是制定消除网络中恶意现象传播策略的一个非常重要的问题,例如流行病和虚假信息,这些现象通常在研究网络免疫中被命名。评估网络攻击有效性的传统方法侧重于测量与整个攻击相关的一些宏观参数,例如网络中发生渗透的临界概率 p_c 和网络中最大组件的相对大小网络 - 巨大的组件,但没有从微观角度考虑攻击,这是对攻击期间节点移除、自身、特征和结果的分析。在本文中,我们提出并应用了最后一种关注攻击微观尺度的方法。基于网络中的渗透理论,我们分析了由于单个节点从网络中移除而导致雪崩结果的现象,即一个节点的移除属于网络的巨型组件导致其他节点也被移除的状态。与它断开连接,这对网络的碎片化(免疫)的贡献比仅删除单个原始节点本身要大得多。具体来说,我们专注于雪崩大小的参数,即由于单个节点移除而与巨型组件断开连接的节点数。关于对 Cayley 树类型的网络的随机攻击,我们通过分析推导出在对它的整个攻击期间发生的雪崩大小的分布,直到网络被拆除(免疫)并终止攻击。
学习网络异构干扰下的个体治疗效果
原文标题: Learning Individual Treatment Effects under Heterogeneous Interference in Networks
地址: http://arxiv.org/abs/2210.14080
作者: Ziyu Zhao, Kun Kuang, Ruoxuan Xiong, Fei Wu
摘要: 如今,通过网络观察数据对个体治疗效果的估计正引起越来越多的关注。网络场景中的一个主要挑战是违反了稳定单元治疗价值假设 (SUTVA),该假设假设一个单元的治疗分配不会影响其他人的结果。在网络数据中,由于干扰,一个单元的结果不仅受其处理(即直接效应)的影响,还受其他处理(即溢出效应)的影响。此外,来自其他单位的影响总是异质的(例如,具有相似兴趣的朋友对一个人的影响不同于具有不同兴趣的朋友)。在本文中,我们专注于在异质干扰下估计个体治疗效果(直接和溢出效应)的问题。为理解决这个问题,我们提出了一种新颖的双重加权回归(DWR)算法,通过同时学习刻画异质干扰的注意力权重和样本权重来消除网络中复杂的混杂偏差。我们将整个学习过程表述为一个双层优化问题。理论上,我们提出了个体治疗效果估计的泛化误差界限。在四个基准数据集上进行的大量实验表明,所提出的 DWR 算法优于在异质干扰下估计个体治疗效果的最先进方法。
Datavoidant:用于解决社交媒体上政治数据空白的人工智能系统
原文标题: Datavoidant: An AI System for Addressing Political Data Voids on Social Media
地址: http://arxiv.org/abs/2210.13594
作者: Claudia Flores-Saviaga, Shangbin Feng, Saiph Savage
摘要: 与代表性不足的社区相关的政治话题的有限信息(数据空白)促进了虚假信息的传播。在代表性不足的社区中与虚假信息作斗争的独立记者报告说,他们感到不知所措,因为他们缺乏必要的工具来理解他们监控的信息和解决数据空白问题。在本文中,我们提出了一个系统来识别和解决代表性不足的社区中的政治数据空白。借助一项表明独立新闻媒体具有解决这些问题的潜力的采访研究,我们设计了一个名为 Datavoidant 的智能协作系统。 Datavoidant 使用最先进的机器学习模型并引入了一个新颖的设计空间,为独立记者提供对数据空白的集体理解,以促进生成内容以覆盖空白。我们与独立的新闻媒体记者(N=22)进行了用户界面评估。这些记者报告说,Datavoidant 的功能使他们能够更快地理解信息生态系统中正在发生的事情,以解决数据空白问题。他们还报告说,他们对自己创建的内容以及他们提出的弥补空白的独特视角更有信心。最后,我们讨论了 Datavoidant 如何实现一个新的设计空间,在这个空间中,个人可以协作以理解他们的信息生态系统并积极制定策略来防止虚假信息。
转自:“网络科学研究速递”微信公众号
如有侵权,请联系本站删除!