2022/3/24 9:11:48 阅读:196 发布者:chichi77
拓扑不平衡对生物医学知识图表示学习的影响;
COVID-19 大流行中有效再生数的每日活动依赖性:来自 GPS 数据的直接建模;
GAC:一种面向未知社会网络中用户激励的深度强化学习模型;
STICC:一种考虑空间连续性的重复地理模式发现的多元空间聚类方法;
同质和异质网络中的回声室和信息传输偏差;
用电路网络逼近城市地区的人流:势场和波动-耗散关系;
网络方法揭示了 COVID-19 下交通对空气污染的时空影响;
转推社区揭示仇恨言论的主要来源;
拓扑不平衡对生物医学知识图表示学习的影响
原文标题: Implications of Topological Imbalance for Representation Learning on Biomedical Knowledge Graphs
地址: http://arxiv.org/abs/2112.06567
作者: Stephen Bonner, Ufuk Kirik, Ola Engkvist, Jian Tang, Ian P Barrett
摘要: 采用机器学习中最近开发的方法已经引起了药物发现知识图 (KG) 的创建,该知识图利用了该领域的相互关联性。基于图的数据建模与 KG 嵌入 (KGE) 方法相结合,很有前景,因为它们提供了更直观的表示,并且适用于预测丢失链接等推理任务。一种常见的应用是生成给定疾病的基因排序列表,其中排序基于感知到的基因与疾病之间关联的可能性。因此,至关重要的是,这些预测不仅具有相关性,而且具有生物学意义。然而,KG 可能直接由于集成的基础数据源或由于图构建中的建模选择而产生偏差,其后果之一是某些实体可能在拓扑上被过度表示。我们展示了这些固有的结构不平衡的影响,导致密集连接的实体在任何情况下都被高度排名。我们为跨不同数据集、模型以及预测任务的这种观察提供支持。此外,我们提出了各种图扰动实验,这些实验为 KGE 模型更受实体频率影响的观察结果提供了更多支持,而不是关系中编码的任何生物信息。我们的结果强调了数据建模选择的重要性,并强调从业者在解释模型输出和 KG 组合期间需要注意这些问题。
COVID-19 大流行中有效再生数的每日活动依赖性:来自 GPS 数据的直接建模
原文标题: Daily-activity-dependency of effective reproduction number in COVID-19 pandemic: direct modelling from GPS data
地址: http://arxiv.org/abs/2203.09531
作者: Jun’ichi Ozaki, Yohei Shida, Hideki Takayasu, Misako Takayasu
摘要: 在 COVID-19 大流行期间,政府在实施流动限制措施方面面临困难,因为尚不清楚大城市的人员流动与感染传播之间的明确定量关系。我们开发了一个模型,该模型可以通过使用东京都市区的智能手机 GPS 数据来定量估计各个地方和活动的感染风险。有效繁殖数直接根据每个地点人口密度的平方定义的传染性社会接触者数量计算得出。考虑到日常活动感染率的差异,“外出”活动,既不是在家也不是工作场所,是其他活动的 28 倍以上。此外,对感染的贡献在很大程度上取决于位置。我们暗示,如果最高风险的位置或活动受到限制,则有效繁殖数量会被充分抑制。我们还讨论了 Delta 变体和疫苗接种的影响。
GAC:一种面向未知社会网络中用户激励的深度强化学习模型
原文标题: GAC: A Deep Reinforcement Learning Model Toward User Incentivization in Unknown Social Networks
地址: http://arxiv.org/abs/2203.09578
作者: Shiqing Wu, Weihua Li, Quan Bai
摘要: 近年来,为人类用户提供激励以吸引他们的注意力和参与度已在许多应用程序中广泛采用。为了有效地激励用户,大多数激励机制根据用户的个人属性(如偏好)来确定激励值。当此类信息不可用时,这些方法可能无效。同时,由于预算限制,可以激励的用户数量也受到限制。有鉴于此,我们打算利用用户之间的社会影响力来最大化激励。通过直接激励社会网络中的有影响力的用户,他们的追随者和朋友可以通过较少的激励或没有激励而受到间接激励。然而,很难在社会网络中预先识别有影响力的用户,因为每对用户之间的影响力强度通常是未知的。在这项工作中,我们提出了一个基于端到端强化学习的框架,名为 Geometric Actor-Critic (GAC),以在有限的预算下发现有效的激励分配政策。更具体地说,所提出的方法可以从高级网络表示中提取信息,以学习有效的激励分配策略。提议的 GAC 只需要社会网络的拓扑结构,不依赖于任何关于用户属性的先验信息。我们使用三个真实世界的社会网络数据集来评估提议的 GAC 的性能。实验结果证明了所提出方法的有效性。
STICC:一种考虑空间连续性的重复地理模式发现的多元空间聚类方法
原文标题: STICC: A multivariate spatial clustering method for repeated geographic pattern discovery with consideration of spatial contiguity
地址: http://arxiv.org/abs/2203.09611
作者: Yuhao Kang, Kunlin Wu, Song Gao, Ignavier Ng, Jinmeng Rao, Shan Ye, Fan Zhang, Teng Fei
摘要: 空间聚类已广泛用于空间数据挖掘和知识发现。理想的多元空间聚类应该考虑空间连续性和空间属性。现有的空间聚类方法可能面临在保持空间连续性的情况下发现重复地理模式的挑战。在本文中,我们提出了一种基于空间 Toeplitz 逆协方差的聚类 (STICC) 方法,该方法同时考虑了地理对象的属性和空间关系以进行多元空间聚类。在进行聚类时,为作为基本单元的每个地理对象创建一个子区域。然后构造一个马尔可夫随机场来表征子区域的属性依赖关系。使用空间一致性策略,鼓励附近的对象属于同一个集群。为了测试所提出的 STICC 算法的性能,我们将其应用于两个用例。与几种基线方法的比较结果表明,在调整后的兰特指数和宏观 F1 得分方面,STICC 显著优于其他方法。还计算了连接计数统计信息,并显示 STICC 很好地保留了空间连续性。这种空间聚类方法可以有益于地理、遥感、交通和城市规划等领域的各种应用。
同质和异质网络中的回声室和信息传输偏差
原文标题: Echo chambers and information transmission biases in homophilic and heterophilic networks
地址: http://arxiv.org/abs/2203.09640
作者: Fernando Diaz-Diaz, Maxi San Miguel, Sandro Meloni
摘要: 我们研究了网络结构特性与合成无标度同嗜/异嗜网络中信息动态之间的相互作用如何产生信息传输偏差。我们提供简单的数学工具来量化这些偏差。简单和复杂传染模型都不足以预测重大偏差。相比之下,混合传染模型(其中同时发生简单传染和复杂传染)会产生三种不同的同质相关偏差:发射率和接受率偏差以及回声室。具有高同质性的经验网络中的模拟证实了这些偏差的存在。我们的研究结果揭示了导致信息源可见性不平等、信息访问减少以及不同群体之间缺乏沟通的机制。
用电路网络逼近城市地区的人流:势场和波动-耗散关系
原文标题: Approximation of human flow in urban areas by a network of electric circuits : Potential fields and fluctuation-dissipation relations
地址: http://arxiv.org/abs/2203.09808
作者: Yohei Shida, Jun’ichi Ozaki, Hideki Takayasu, Misako Takayasu
摘要: 由于大数据,物理定律在非物质上的扩展已经取得了许多成功,而人类流动性是科学前沿课题之一。最近的 GPS 技术使追踪数百万人的详细轨迹成为可能,宏观方法如城市间人流的重力定律和个体起点-目的地分布的微观方法备受关注。然而,充分利用GPS数据实现大都市交通预测和城市规划,还需要一个更通用、适用性更广的基础模型。在这里,基于将移动的人视为带电粒子的新想法,我们引入了一种复杂的方法,将宏观人流映射到定义在大都市区的假想电路上的电流。发现电导几乎与每个位置的最大电流成正比,并且通过电势的时间变化很好地描述了早晚同步的人流。令人惊讶的是,著名的涨落耗散定理成立,即电流的变化与类似于普通材料的电导率成正比。特别是在大流行期间,这样的工具可能会为管理人流的政策制定提供宝贵的见解。
网络方法揭示了 COVID-19 下交通对空气污染的时空影响
原文标题: Network approach reveals the spatiotemporal influence of traffic to air pollution under the COVID-19
地址: http://arxiv.org/abs/2203.09815
作者: Weiping Wang, Saini Yang, Kai Yin, Zhidan Zhao, Na Ying, Jingfang Fan
摘要: 空气污染导致广泛的环境和健康问题,严重影响城市居民的生活质量。交通对人类生活至关重要,其排放物是污染的主要来源,加剧了城市空气污染。然而,城市交通排放与空气污染之间的复杂相互作用尚未揭示。尤其是COVID-19的蔓延,导致各个城市根据当地疫情实施不同的交通限制政策,这为探索城市交通与空气污染之间的关系提供了可能。在这里,我们通过基于交通指数和空气质量指数重建多层复杂网络来探索交通对空气污染的影响。我们发现,京津冀(BTH)、成渝经济圈(CCS)和华中(CC)地区的空气质量在疫情爆发后受到周边交通状况的显著影响。在不同的抗疫阶段下,其他城市的交通对空气污染的影响在第二阶段(也称为遏制病毒的初步进展)达到最大。对于 BTH 和 CC 地区,交通对空气质量的影响在前两个阶段变大,然后下降,而对于 CC,区域间影响显著出现在第 3 阶段。然而,对于其他地区,变化并不明显。我们提出的基于网络的框架为交通和环境领域提供了一个新的视角,可能有助于指导政府制定空气污染缓解和交通限制政策。
转推社区揭示仇恨言论的主要来源
原文标题: Retweet communities reveal the main sources of hate speech
地址: http://arxiv.org/abs/2105.14898
作者: Bojan Evkoski, Andraz Pelicon, Igor Mozetic, Nikola Ljubesic, Petra Kralj Novak
摘要: 我们解决了识别 Twitter 上仇恨言论主要来源的挑战性问题。一方面,我们仔细注释了大量的仇恨言论推文,并部署了先进的深度学习来生成高质量的仇恨言论分类模型。另一方面,我们创建转推网络、检测社区并监控其随时间的演变。这种组合方法应用于三年的斯洛文尼亚 Twitter 数据。我们报告了一些有趣的结果。仇恨言论主要是与政治和意识形态问题相关的攻击性推文。不可接受的推文的份额随着时间的推移适度增加,到 2020 年底从最初的 20% 增加到 30%。不可接受的推文被转发的频率明显高于可接受的推文。大约 60% 的不可接受的推文是由一个规模适中的右翼社区制作的。机构 Twitter 帐户和媒体帐户发布的不可接受的推文明显少于个人帐户。事实上,不可接受的推文的主要来源是匿名账户,以及在 2018-2020 年间被暂停或关闭的账户。
如有侵权,请联系本站删除!