2022/4/20 14:27:45 阅读:271 发布者:chichi77
CGC:用于社区检测和跟踪的对比图聚类;
包容性释放了团队中性别多样性的创造潜力;
标记网络与未标记网络的熵;
通过社会拓扑和双重角色用户依赖改进信息级联建模;
俄乌战争推特数据集;
用于量化社会网络两极分化的基于多意见的指标:来自印度的案例研究;
通过有限回忆重复的影响;
推特在预测选举结果方面的双层评估:2020 年德里议会选举;
基于文本和社交图谱的自监督学习的谣言检测;
机器人、虚假信息和特朗普的第一次弹劾;
以太坊庞氏检测的异构特征增强;
论邢天与网上反华情绪的坚守;
二维 Motter 和 Lai 模型中的级联交通拥堵;
使用基于主体的网络模型评估欧洲大学 Omicron 传输缓解策略的有效性;
CGC:用于社区检测和跟踪的对比图聚类
原文标题: CGC: Contrastive Graph Clustering for Community Detection and Tracking
地址: http://arxiv.org/abs/2204.08504
作者: Namyong Park, Ryan Rossi, Eunyee Koh, Iftikhar Ahamath Burhanuddin, Sungchul Kim, Fan Du, Nesreen Ahmed, Christos Faloutsos
摘要: 鉴于网络数据中可能发生在不同时间的实体及其交互,我们如何找到实体社区并跟踪它们的演变?在本文中,我们从图聚类的角度来处理这一重要任务。最近,通过深度聚类方法已经在各个领域实现了最先进的聚类性能。特别是,深度图聚类(DGC)方法通过在联合优化框架中学习节点表示和聚类分配,成功地将深度聚类扩展到图结构数据。尽管建模选择(例如编码器架构)存在一些差异,但现有的 DGC 方法主要基于自动编码器,并使用相同的聚类目标,但适应性相对较小。此外,虽然许多现实世界的图是动态的,但以前的 DGC 方法只考虑静态图。在这项工作中,我们开发了 CGC,这是一种用于图聚类的新型端到端框架,它与现有方法根本不同。 CGC 在对比图学习框架中学习节点嵌入和集群分配,其中正样本和负样本在多级方案中仔细选择,以反映分层社区结构和网络同质性。此外,我们将 CGC 扩展到时间演化数据,其中含时图聚类以增量学习方式执行,具有检测变化点的能力。对真实世界图的广泛评估表明,所提出的 CGC 始终优于现有方法。
包容性释放了团队中性别多样性的创造潜力
原文标题: Inclusion unlocks the creative potential of gender diversity in teams
地址: http://arxiv.org/abs/2204.08505
作者: Balazs Vedres, Orsolya Vasarhelyi
摘要: 团队中的多样性可以提高创造力,而性别多样性被证明是集体创造力的贡献者。我们通过分析 4011 个视频博弈项目中的团队,表明性别多样性需要包容才能带来创造力的好处。根据过去合作的加权网络记录数据,我们制定了四种包容性衡量标准,这取决于缺乏隔离、跨性别的紧密联系以及将女性纳入团队网络的核心。我们发现,没有包容性的性别多样性对创造力没有贡献,而在最大包容性的情况下,多样性的一个标准差变化会导致创造力的 0.04 到 0.09 个标准差变化,具体取决于包容性的衡量标准。为了从多元化中获得创造性收益,开发公司需要包括 23% 或更多的女性开发人员(相对于 15% 的平均女性比例),并将她们纳入团队的各个方面。低多样性的包容具有负面影响。通过分析公司内跨博弈的多样性和包容性的顺序,我们发现,与将已经存在跨性别联系的女性开发者加入团队相比,先增加多样性,然后发展包容性可以带来更高的多样性和包容性。
标记网络与未标记网络的熵
原文标题: Entropy of labeled versus unlabeled networks
地址: http://arxiv.org/abs/2204.08508
作者: Jeremy Paton, Harrison Hartle, Jakob Stepanyants, Pim van der Hoorn, Dmitri Krioukov
摘要: 网络的结构是一个未标记的图,但大多数复杂网络模型中的图都是用无意义的随机整数标记的。相关的标签噪声总是可以忽略不计,还是可以压倒网络结构信号?为理解决这个问题,我们引入并考虑了流行网络模型的稀疏未标记版本,并将它们的熵与原始标记版本进行了比较。我们表明,标记和未标记的 Erdos-Renyi 图在熵上是等价的,即使它们的度数分布非常不同。配置模型的标记和未标记版本在它们的主要熵项中可能有不同的前因数,尽管这仍然是推测性的。我们的主要结果是标记和未标记的一维随机几何图的熵的上限和下限。我们表明,与标记的熵相比,它们的未标记熵可以忽略不计。这些结果表明,在稀疏网络中,无意义标记的熵可能会主导网络结构的熵,这表明需要彻底重新检查网络建模的统计基础。
通过社会拓扑和双重角色用户依赖改进信息级联建模
原文标题: Improving Information Cascade Modeling by Social Topology and Dual Role User Dependency
地址: http://arxiv.org/abs/2204.08529
作者: Baichuan Liu, Deqing Yang, Yueyi Wang, Yuchen Shi
摘要: 在过去的十年中,社会网络上的信息传播(也称为信息级联)由于其在许多领域的应用价值而得到了广泛的研究。近年来,包括基于递归神经网络的模型在内的许多序列模型已被广泛用于预测信息级联。然而,序列模型刻画的级联序列中的用户依赖关系通常是单向的,并且与扩散树不一致。例如,后继的真正触发可能是非直接前驱,而不是序列中的直接前驱。为了更充分地刻画对精确级联建模至关重要的用户依赖关系,我们提出了一种非序列信息级联模型,称为 TAN-DRUD(具有双重角色用户依赖关系的拓扑感知注意网络)。 TAN-DRUD 受到经典通信理论的启发,通过刻画信息发送者和接收者的双重角色用户依赖关系,在信息级联建模上获得了令人满意的性能。此外,TANDRUD 将社会拓扑整合到两级注意网络中,以增强信息扩散预测。我们对三个级联数据集的广泛实验表明,我们的模型不仅优于最先进的级联模型,而且能够利用拓扑信息和推断扩散树。
俄乌战争推特数据集
原文标题: Twitter Dataset on the Russo-Ukrainian War
地址: http://arxiv.org/abs/2204.08530
作者: Alexander Shevtsov, Christos Tzagkarakis, Despoina Antonakaki, Polyvios Pratikakis, Sotiris Ioannidis
摘要: 2022 年 2 月 24 日,俄罗斯入侵乌克兰,也就是现在的俄乌战争。我们已经从 Twitter API 发起了一个持续的数据集采集。直到撰写本文的那一天,数据集已达到 5730 万条推文,来自 770 万用户。我们应用了初始音量和情绪分析,而数据集可用于对主题分析、仇恨言论、宣传识别进行进一步探索性调查,甚至显示潜在的恶意实体,如僵尸网络。
用于量化社会网络两极分化的基于多意见的指标:来自印度的案例研究
原文标题: A Multi-Opinion Based Metric for Quantifying Polarization on Social Networks: A Case Study from India
地址: http://arxiv.org/abs/2204.08697
作者: Maneet Singh, S.R.S. Iyengar, Rishemjit Kaur
摘要: 众所周知,社交媒体是政治和社会交流的温床,分析观点的两极分化一直受到关注。在这项研究中,我们提出了一种量化社会网络极化的措施。与最先进的方法不同,所提出的指标不假设两种意见的情况,而是适用于多种意见。我们的指标在基于二元意见的基准网络以及具有多意见场景和不同程度两极分化的综合意见标签社会网络上进行了测试。该指标显示了具有不同极化程度的社会网络的可喜结果。然后,该方法被用于使用从 Twitter 获得的关于印度实施《公民身份修正法》(CAA)的基于三意见(“赞成”、“反对”和“中立”)的通信的数据来研究两极分化。我们已经测量了各种社会网络上的两极分化,例如基于转发或提及的通信网络、基于关注者-关注者连接的社交关系网络以及最后通过将通信网络与社交关系网络相结合的混合网络。所提出的方法表明用户在 Twitter 上分享帖子方面存在高度两极分化,从而表明该问题具有高度争议性。我们还获得了社会关系网络的高极化分数。因此表明用户之间存在同质性,即对 CAA 的看法与他们在平台上的社会关系一致。对于基于转推的混合网络,我们的极化指标返回的分数强调了意见是转推行为的关键驱动因素,而与用户之间的社会关系无关。相反,用户之间基于提及的通信本质上并没有两极分化。
通过有限回忆重复的影响
原文标题: Influence of Repetition through Limited Recall
地址: http://arxiv.org/abs/2204.08741
作者: Jad Sassine, M. Amin Rahimian, Dean Eckles
摘要: 接收到许多信号的决策者会受到不完全回忆的影响。当从社交媒体平台上从许多发件人那里汇总消息的提要中学习时,这一点尤其重要。在本文中,我们研究了一种从提要中学习的程式化模型,并强调了由于召回不完善而导致的低效率。在我们的模型中,无法回忆特定消息来自于产生干扰的消息累积。我们根据每个发送者发送消息的速率和干扰强度来描述每个发送者的影响。我们的分析表明,不完美的召回不仅会导致有限人口中的重复计算和极端意见,而且随着发送者人口的增加,还会阻碍接收者学习真实状态的能力。我们估计了在线实验中的干扰强度,其中参与者暴露于(非信息性)重复消息并且他们需要估计其他人的意见。结果表明,在意见不一的参与者中,干扰发挥了重要作用并且较弱。我们的工作对网络中的信息传播有影响,尤其是当它是虚假的,因为它比真实信息更容易被共享和重复。
推特在预测选举结果方面的双层评估:2020 年德里议会选举
原文标题: A Bi-level assessment of Twitter in predicting the results of an election: Delhi Assembly Elections 2020
地址: http://arxiv.org/abs/2204.08746
作者: Maneet Singh, S.R.S. Iyengar, Akrati Saxena, Rishemjit Kaur
摘要: 选举是任何民主国家的支柱,选民选举候选人作为他们的代表。社交网站的出现为政党及其候选人提供了一个与选民联系以传播其政治思想的平台。我们的研究旨在使用 Twitter 评估 2020 年举行的德里议会选举的结果,采用双层方法,即关于政党及其候选人。我们分析了选举结果与不同候选人和政党在 Twitter 上的活动的相关性,以及选民对他们的反应,尤其是选民对政党的提及和情绪。候选人的 Twitter 个人资料在政党层面和候选人层面进行比较,以评估他们与选举结果的关联。我们观察到关注者的数量和对候选人推文的回复是预测实际选举结果的良好指标。然而,我们观察到,推文中提及某个政党的推文数量以及推文中显示的选民对该政党的情绪与选举结果不一致。我们还在语言、词嵌入和道德维度等各种特征上使用机器学习模型来预测选举结果(输赢)。使用推文特征的随机森林模型为预测推文是否属于获胜或失败的候选人提供了有希望的结果。
基于文本和社交图谱的自监督学习的谣言检测
原文标题: Rumor Detection with Self-supervised Learning on Texts and Social Graph
地址: http://arxiv.org/abs/2204.08838
作者: Yuan Gao, Xiang Wang, Xiangnan He, Huamin Feng, Yongdong Zhang
摘要: 近年来,谣言检测已成为一个新兴且活跃的研究领域。其核心是对丰富信息中固有的谣言特征进行建模,例如社会网络中的传播模式和帖子内容中的语义模式,并将它们与真相区分开来。然而,现有的谣言检测工作在异构信息建模方面存在不足,要么仅使用单个信息源(例如社会网络或帖子内容),要么忽略多个源之间的关系(例如通过简单的连接融合社交和内容特征)。因此,他们在全面理解谣言和准确检测谣言方面可能存在缺陷。在这项工作中,我们探索了异构信息源上的对比自我监督学习,以揭示它们之间的关系并更好地表征谣言。从技术上讲,我们用一个辅助的自我监督任务来补充检测的主要监督任务,该任务通过后自我歧视丰富了后表示。具体来说,给定帖子的两个异构视图(即编码社交模式和语义模式的表示),通过最大化同一帖子的不同视图与其他帖子的视图之间的互信息来完成区分。考虑到信息源的不同关系,我们设计了集群方式和实例方式来生成视图并进行区分。我们将此框架称为自监督谣言检测 (SRD)。对三个真实世界数据集的广泛实验验证了 SRD 在社交媒体上自动检测谣言的有效性。
机器人、虚假信息和特朗普的第一次弹劾
原文标题: Bots, Disinformation, and the First Trump Impeachment
地址: http://arxiv.org/abs/2204.08915
作者: Michael Rossetti, Tauhid Zaman
摘要: 我们在第一次弹劾美国总统唐纳德特朗普期间研究了 Twitter 上机器人和 Qanon 阴谋论支持者的行为。在涵盖弹劾的 103 天期间,我们收集了来自 360 万用户的超过 6770 万条推文,以及他们的 5360 万边追随者网络。我们发现机器人占所有用户的 1%,但在 Qanon 支持者中的流行率接近 10%。尽管数量不多,但机器人产生了超过 31% 的弹劾相关推文。我们还发现,机器人会分享更多虚假信息,但使用的有害语言比其他用户少。 Qanon 支持者的追随者网络呈现出分层结构,机器人充当中心枢纽,周围环绕着孤立的人类。我们使用广义谐波影响中心性度量来量化机器人对弹劾讨论的日常影响。总体而言,我们发现,由于数量较多,支持特朗普的机器人在大多数情况下具有更大的影响力。在每个机器人的基础上,反特朗普和支持特朗普的机器人具有相似的影响,而 Qanon 机器人的影响小于非 Qanon 机器人。
以太坊庞氏检测的异构特征增强
原文标题: Heterogeneous Feature Augmentation for Ponzi Detection in Ethereum
地址: http://arxiv.org/abs/2204.08916
作者: Chengxiang Jin, Jie Jin, Jiajun Zhou, Jiajing Wu, Qi Xuan
摘要: 区块链技术在引发新的工业和技术革命的同时,也带来了新的挑战。近期,庞氏骗局、洗钱等一大批带有“区块链”傀儡的新型骗局不断涌现,严重威胁金融安全。区块链中现有的欺诈检测方法主要集中在人工特征和图分析上,首先使用部分区块链数据构建同质交易图,然后使用图分析检测异常,导致模式信息丢失。在本文中,我们主要关注庞氏骗局检测并提出了 HFAug,这是一个通用的异构特征增强模块,可以刻画与帐户行为模式相关的异构信息,并且可以与现有的庞氏检测方法相结合。 HFAug 在辅助异构交互图中学习基于元路径的行为特征,并将异构特征聚合到执行庞氏检测方法的同构中的相应帐户节点。综合实验结果表明,我们的 HFAug 可以帮助现有的庞氏检测方法在以太坊数据集上实现显著的性能提升,表明异构信息在检测庞氏骗局方面的有效性。
论邢天与网上反华情绪的坚守
原文标题: On Xing Tian and the Perseverance of Anti-China Sentiment Online
地址: http://arxiv.org/abs/2204.08935
作者: Xinyue Shen, Xinlei He, Michael Backes, Jeremy Blackburn, Savvas Zannettou, Yang Zhang
摘要: 恐华症,即反华情绪,在网络上已经存在很长时间了。 COVID-19 的爆发和延长的隔离进一步扩大了它。然而,我们缺乏对恐华症的成因以及它如何随着时间演变的定量理解。在本文中,我们在 2016 年至 2021 年间对两个主流和边网络社区进行了大规模的恐华纵向测量。通过分析 Reddit 的 8B 帖子和 4chan /pol/ 的 206M 帖子,我们调查了恐华症的起源、演变和内容。我们发现,与中国没有直接关系的政治事件可能会引发反华内容,例如美国退出《巴黎协定》。在 COVID-19 大流行期间,即使有仇恨言论禁令政策,每天使用恐华诽谤的人也显著增加。我们还表明,随着 COVID-19 的兴起,“中国”和“中国人”这两个词的语义正在转向恐华诽谤,并且在大流行期间保持不变。我们进一步使用主题建模来展示恐华讨论的主题非常多样化和广泛。我们发现两个网络社区都有一些共同的恐华话题,比如民族、经济和商业、武器和军事、外交关系等。但是,与 4chan 的 /pol/ 相比,更多与日常生活相关的话题包括食物、博弈和股票在 Reddit 上找到。我们的发现还表明,与 COVID-19 相关和指责中国政府的话题在大流行期间更为普遍。据我们所知,这篇论文是对恐华症最长的量化测量。
二维 Motter 和 Lai 模型中的级联交通拥堵
原文标题: Cascading traffic jamming in a two-dimensional Motter and Lai model
地址: http://arxiv.org/abs/2204.09011
作者: Gabriel Cwilich, Sergey V. Buldyrev
摘要: 我们使用 Motter 和 Lai 模型研究了二维随机几何图上的级联交通拥堵。交通拥堵是由局部攻击使圆形区域或一定大小的线失效,以及对随机选择的相同数量的节点的分散攻击造成的。我们调查是否存在攻击的临界尺寸,超过该临界尺寸的网络由于级联干扰而完全阻塞,以及该临界尺寸如何取决于图的平均度数langle krangle,节点数系统中的 N,以及 Motter 和 Lai 模型的公差参数 alpha。
使用基于主体的网络模型评估欧洲大学 Omicron 传输缓解策略的有效性
原文标题: Assessment of the effectiveness of Omicron transmission mitigation strategies for European universities using an agent-based network model
地址: http://arxiv.org/abs/2201.08850
作者: Jana Lasser, Timotheus Hell, David Garcia
摘要: 在 COVID-19 大流行期间,让大学全面恢复校园运营一直是许多国家的一个有争议的讨论。密集课程环境中大规模爆发的风险与面对面教学的好处形成鲜明对比。传播风险取决于一系列参数,例如疫苗接种覆盖率和有效性、接触人数和采用非药物干预措施 (NPI)。由于欧洲普遍的学术自由,许多大学被要求自主决定和实施干预措施并规范校园运作。在疫苗接种覆盖率和病毒参数迅速变化的背景下,大学往往缺乏足够的科学洞察力来做出这些决定。为理解决这个问题,我们分析了一所欧洲中型大学的 10755 名学生和 974 名教职员工的传输动力学的校准、数据驱动的基于主体的模拟。我们使用从学生入学数据重建的协同定位网络,并根据教育机构的疫情规模分布校准传播风险。我们专注于可操作的干预措施,这些干预措施是大学现有决策过程的一部分,为具体的政策决策提供指导。在这里,我们表明,对于 SARS-CoV-2 病毒的 Omicron 变体,鉴于最近报告的奥地利学生的疫苗接种覆盖率约为 80%,即使减少 25% 的入住率和普遍使用口罩也不足以防止大规模爆发.我们的研究结果表明,如果需要在校园里有学生和教职员工,那么在大学环境中使用现有疫苗和 NPI 来控制病毒的传播是不可行的。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。
如有侵权,请联系本站删除!