连续时间网络中依赖关系事件的多元社区霍克斯模型;
知识图谱表示学习中负抽样的综合分析;
文本丰富的稀疏双曲图卷积网络;
超链路预测综述;
用于 COVID-19 预测和情景预测的 SIkJalpha 模型的变化;
生物燃料指令是否具有成本效益? — 分析运输燃料和生物质使用以实现欧洲能源系统的排放目标;
测量非洲城市的形态;
社交媒体中真假谣言分享的机制:群体智慧还是从众行为?;
金融大甩卖作为连续状态的复杂传染;
在受控大流行中规划干预措施:COVID-19 案例;
连续时间动态符号网络中的符号链路表示;
Haros 图:实数的奇异表示;
低于流行阈值但超出群体免疫的地方性传染状态;
连续时间网络中依赖关系事件的多元社区霍克斯模型
原文标题: The Multivariate Community Hawkes Model for Dependent Relational Events in Continuous-time Networks
地址: http://arxiv.org/abs/2205.00639
作者: Hadeel Soliman, Lingfei Zhao, Zhipeng Huang, Subhadeep Paul, Kevin S. Xu
摘要: 随机块模型(SBM)是最广泛使用的网络数据生成模型之一。许多连续时间动态网络模型都建立在与 SBM 相同的假设之上:所有节点对之间的边或事件在给定块或社区成员资格的情况下是有条件独立的,这阻止了它们再现高阶模体,例如通常常见的三角形在真实网络中观察到。我们提出了多元社区霍克斯(MULCH)模型,这是一种非常灵活的基于社区的连续时间网络模型,它使用结构化的多元霍克斯过程在节点对之间引入依赖关系。我们使用谱聚类和基于似然的局部细化程序来拟合模型。我们发现我们提出的 MULCH 模型在预测和生成任务方面都比现有模型准确得多。
知识图谱表示学习中负抽样的综合分析
原文标题: Comprehensive Analysis of Negative Sampling in Knowledge Graph Representation Learning
地址: http://arxiv.org/abs/2206.10140
作者: Hidetaka Kamigaito, Katsuhiko Hayashi
摘要: 负采样 (NS) 损失在学习知识图嵌入 (KGE) 以处理大量实体方面发挥着重要作用。但是,适当地选择了KGE降低没有超参数的降解,例如NS损失中的余量和负样本的数量。目前,经验超参数调整以计算时间为代价解决了这个问题。为理解决这个问题,我们从理论上分析了 NS 损失来辅助超参数调整,并理解在 KGE 学习中更好地利用 NS 损失。我们的理论分析表明,具有限制值范围的评分方法,如 TransE 和 RotatE,需要适当调整边项或负样本数量,这与没有限制值范围的方法不同,如 RESCAL、ComplEx 和 DistMult。我们还提出了专门用于从理论方面研究的 KGE 中的 NS 损失的子采样方法。我们对 FB15k-237、WN18RR 和 YAGO3-10 数据集的实证分析表明,实际训练的模型的结果与我们的理论发现一致。
文本丰富的稀疏双曲图卷积网络
原文标题: Text Enriched Sparse Hyperbolic Graph Convolutional Networks
地址: http://arxiv.org/abs/2207.02368
作者: Nurendra Choudhary, Nikhil Rao, Karthik Subbian, Chandan K. Reddy
摘要: 异构网络将包含具有不同边类型的文本的信息节点连接起来,通常用于在各种实际应用中存储和处理信息。图神经网络 (GNN) 及其双曲线变体提供了一种有前途的方法,可以分别通过邻域聚合和分层特征提取在低维潜在空间中对此类网络进行编码。然而,这些方法通常会忽略元路径结构和可用的语义信息。此外,这些方法对训练数据中存在的噪声很敏感。为理解决这些限制,在本文中,我们提出了文本丰富的稀疏双曲图卷积网络(TESH-GCN),以使用语义信号刻画图的元路径结构,并进一步改进大型异构图中的预测。在 TESH-GCN 中,我们提取语义节点信息,该信息连续充当连接信号,从重构的双曲图卷积层中的稀疏邻接张量中提取相关节点的局部邻域和图级元路径特征。这些提取的特征与语言模型中的语义特征(为了鲁棒性)一起用于最终的下游任务。对各种异构图数据集的实验表明,我们的模型在链路预测任务上大大优于当前最先进的方法。与现有的双曲线方法相比,我们还通过重新制定的双曲线图卷积报告了训练时间和模型参数的减少。此外,我们通过在图结构和文本中试验不同级别的模拟噪声来说明我们模型的鲁棒性,并且还通过分析提取的元路径提出了一种解释 TESH-GCN 预测的机制。
超链路预测综述
原文标题: A Survey on Hyperlink Prediction
地址: http://arxiv.org/abs/2207.02911
作者: Can Chen, Yang-Yu Liu
摘要: 作为图上链路预测的自然扩展,超链路预测旨在推断超图中缺失的超链接,其中一个超链接可以连接两个以上的节点。超链路预测在广泛的系统中都有应用,从化学反应网络、社会交流网络到蛋白质-蛋白质相互作用网络。在本文中,我们对超链路预测进行了系统而全面的调查。我们提出了一种新的分类法,将现有的超链路预测方法分为四类:基于相似性、基于概率、基于矩阵优化和基于深度学习的方法。为了比较不同类别方法的性能,我们使用每个类别的代表性方法对各种超图应用程序进行基准研究。值得注意的是,基于深度学习的方法在超链路预测中优于其他方法。
用于 COVID-19 预测和情景预测的 SIkJalpha 模型的变化
原文标题: The Variations of SIkJalpha Model for COVID-19 Forecasting and Scenario Projections
地址: http://arxiv.org/abs/2207.02919
作者: Ajitesh Srivastava
摘要: 我们在 COVID-19 大流行初期提出了 SIkJalpha 模型。在过去两年中,随着大流行的演变,增加了更多的复杂性,以捕捉有助于预测未来情景的关键因素和变量。在整个大流行期间,已经组织了多模型协作工作来预测 COVID-19 的短期结果(病例、死亡和住院)和长期情景预测。我们已经参与了五次这样的努力。本文介绍了 SIkJalpha 模型的演变及其自大流行开始以来用于提交这些协作努力的许多版本。
生物燃料指令是否具有成本效益? — 分析运输燃料和生物质使用以实现欧洲能源系统的排放目标
原文标题: Are biofuel mandates cost-effective? — an analysis of transport fuels and biomass usage to achieve emissions targets in the European energy system
地址: http://arxiv.org/abs/2207.03000
作者: Markus Millinger, Lina Reichenberg, Fredrik Hedenus, Göran Berndes, Elisabeth Zeyen, Tom Brown
摘要: 要实现雄心勃勃的排放目标,需要针对交通运输部门难以实现电气化的部分采取减排措施。基于生物质的生物燃料、基于可再生氢和碳源的电燃料以及通过二氧化碳去除 (CDR) 补偿的化石燃料是主要选择。目前,生物燃料是唯一可大规模使用的可再生燃料,并受到混合要求的刺激。在这里,除了所有能源部门的总体排放上限外,我们还估算了执行此类指令的系统成本。我们使用具有高时间分辨率的与行业耦合的欧洲能源系统模型 PyPSA-Eur-Sec 对 2040 年和 2060 年的夜间情景进行建模。确定了以下成本驱动因素:(i) 由于稀缺性而导致的高生物质成本,(ii) 将生物质用于工业供热和热电联产 (CHP) 与碳刻画的竞争性使用的机会成本,以及 (iii) 较低的可扩展性和一般与结合 CDR 的电燃料和化石燃料相比,生物燃料的成本更高。到 2040 年减排目标为 -80%,可变可再生能源、热力、工业和运输的部分电气化以及热电联产和工业热能的生物质使用对于以最低成本实现目标非常重要。减少剩余液体化石燃料的使用会增加系统成本,50% 的生物燃料要求将成本增加 128-2290 亿欧元,或液体燃料成本的 39-82%。由于 2060 年的负排放目标为 -105%,因此需要减少燃料选择,而电燃料或使用 CDR 来抵消化石燃料排放比生物燃料更具竞争力。生物质在热电联产和工业供热中是首选,结合碳刻画以服务于负排放或电燃料生产,从而多次利用生物碳。敏感性分析揭示了重大的不确定性,但始终支持更高的生物燃料要求会导致更高的成本。
测量非洲城市的形态
原文标题: Measuring the morphology of African cities
地址: http://arxiv.org/abs/2207.03003
作者: Rafael Prieto Curiel, Jorge E. Patino, Brilé Anderson
摘要: 非洲大部分基础设施尚未建成。这些新建筑的建造地点和方式至关重要,因为今天的决定将持续数十年。由此产生的城市形态对城市的新陈代谢和能源需求具有持久的影响。由于缺乏数据,估计和预测这些需求在非洲一直具有挑战性。然而,鉴于预计未来 30 年非洲将出现大规模城市化,需要克服这一障碍,以引导城市走上可持续发展和弹性的轨道。根据非洲大陆近 2 亿座建筑物的位置和表面,我们估计了近 6000 个城市的建筑物间距离。卫星图像可以构建城市形态指标,以比较非洲城市的伸长、扩张和空旷。我们建立了 BASE 模型,其中建筑物之间的平均距离是与建筑物数量及其平均面积以及其空间布置的蔓延和延伸率的函数关系。城市中建筑物之间的平均距离——我们代表其与流动性相关的能源需求——的增长速度快于其人口的平方根,这是由于建筑物数量的亚线性增长和建筑数量的亚线性增长的综合影响规模和蔓延。我们表明,当一个城市的人口增加一倍时,与通勤相关的能源需求就会增加三倍。
社交媒体中真假谣言分享的机制:群体智慧还是从众行为?
原文标题: Mechanisms of True and False Rumor Sharing in Social Media: Wisdom-of-Crowds or Herd Behavior?
地址: http://arxiv.org/abs/2207.03020
作者: Nicolas Pröllochs, Stefan Feuerriegel
摘要: 社交媒体平台传播大量在线内容,包括真实的,尤其是虚假的谣言。以前的文献已经研究了线下谣言的传播,但需要更多的研究来理解网络谣言的传播。在本文中,我们研究了真假谣言在社交媒体分享行为中的寿命和人群效应的作用。基于 126,301 个 Twitter 级联,我们发现分享行为的特点是生命周期和人群效应,这解释了真实谣言与虚假谣言传播的差异。在其他条件相同的情况下,我们发现更长的生命周期与更少的分享活动相关,但分享的减少对于虚假的谣言比真实的谣言要大。因此,寿命是解释为什么虚假谣言消失的重要决定因素。此外,我们发现虚假谣言的传播具有从众倾向(而不是群众的智慧),从而虚假谣言的传播在更大的转发深度处扩散。这些发现解释了真假谣言传播动态的差异,并进一步为社交媒体平台提供了实际意义。
金融大甩卖作为连续状态的复杂传染
原文标题: Financial fire sales as continuous-state complex contagion
地址: http://arxiv.org/abs/2207.03194
作者: Tomokatsu Onaga, Fabio Caccioli, Teruyoshi Kobayashi
摘要: 金融系统中的交易活动创造了系统性风险传播的各种渠道。一个重要的传染渠道是金融抛售,银行倒闭导致资产价格因资产清算而下跌,进而推动银行进一步违约,引发下一轮清算。这个过程可以被认为是复杂的传染,但它不能使用传统的二元状态传染模型来建模,因为存在代表资产价格的连续状态。在这里,我们开发了一个连续状态级联的阈值模型,其中每个节点的状态由实数值表示。我们表明,只要状态数量适中,多状态传染模型的解(其中连续状态被离散化)就可以准确地复制模拟的连续状态分布。这种离散化方法使我们能够利用近似主方程 (AME) 的力量来追踪违约银行部分的轨迹,并获得表征资产-银行二分网络上抛售动态的资产价格分布。我们使用交易所交易基金 (ETF) 中资产持有关系的真实数据来检验所提出方法的准确性。
在受控大流行中规划干预措施:COVID-19 案例
原文标题: Planning interventions in a controlled pandemic: the COVID-19 case
地址: http://arxiv.org/abs/2207.03280
作者: Franco Galante, Chiara Ravazzi, Michele Garetto, Emilio Leonardi
摘要: 限制社会和经济活动以及疫苗接种一直是遏制 COVID-19 流行的关键干预措施。我们工作的重点是更好地理解政策制定者在新流行病爆发所造成的条件和不确定性下可用的选择。更准确地说,我们关注两种控制策略。第一个目标是控制新感染率,以防止医疗保健系统拥挤。后者直接控制住院和重症监护病房(ICU)的职业。通过一阶分析,我们表明,一方面,由于接触者追踪困难和缺乏准确信息,控制传播速度可能难以导致不稳定。另一方面,虽然住院和 ICU 很容易到达,并且比新感染率低,但在控制回路中引入了延迟,这可能会危及系统稳定性。我们的框架允许在以下情况下评估上述策略对经济和社会成本的影响:i)在死亡率和风险暴露方面的人口异质性; ii) 流行病学曲线的闭环控制; iii) 个人的渐进式疫苗接种。
连续时间动态符号网络中的符号链路表示
原文标题: Signed Link Representation in Continuous-Time Dynamic Signed Networks
地址: http://arxiv.org/abs/2207.03408
作者: Mohit Raghavendra, Kartik Sharma, Anand Kumar M, Srijan Kumar
摘要: 符号网络允许我们对双向关系和交互进行建模,例如朋友/敌人、支持/反对等。这些交互在真实数据集中通常是暂时的,其中节点和边随着时间的推移而出现。因此,学习有符号网络的动态对于有效预测未来链接的符号和强度至关重要。现有的作品模型要么是符号网络,要么是动态网络,但不能同时建模。在这项工作中,我们研究了动态符号网络,其中链接既是符号的又是随着时间的推移而演变的。我们的模型使用内存模块和平衡聚合(因此得名 SEMBA)来学习符号链接的演变。每个节点维护两个独立的内存编码,用于正交互和负交互。在新的边到来时,每个交互节点都会在利用平衡理论的同时将这些符号信息与其记忆聚合起来。节点嵌入是使用更新的内存生成的,然后用于训练多个下游任务,包括链接符号预测和链接权重预测。我们的结果表明,SEMBA 通过实现高达 8% 的 AUC 增加和高达 50% 的 FPR 减少,在符号预测任务上优于所有基线。预测有符号权重任务的结果表明,SEMBA 将均方误差降低了 9%,同时在预测的有符号权重分布上的 KL 散度降低了 69%。
Haros 图:实数的奇异表示
原文标题: Haros graphs: an exotic representation of real numbers
地址: http://arxiv.org/abs/2207.03425
作者: Jorge Calero-Sanz, Bartolo Luque, Lucas Lacasa
摘要: 本文介绍了 Haros 图,这是一种结构,它提供了单位间隔内实数的图论表示,这些实数通过 Farey 二叉树中的路径到达。我们展示了 Haros 图的拓扑结构如何将实数自然分类为家庭层次结构。为了揭示这种分类,我们在这些图上引入了熵泛函,并表明由于其分形性质,它可以用广义德拉姆曲线表示。我们表明,该熵在黄金数的倒数处达到全局最大值,否则显示与特定无理数(贵族数)和有理数族相关的局部最大值和最小值的丰富层次结构,总体上提供了奇异的分类和表示根据熵原理的实数。我们以一些猜想结束这篇论文,并概述了一个关于 Haros 图的研究计划。
低于流行阈值但超出群体免疫的地方性传染状态
原文标题: Endemic infectious states below the epidemic threshold and beyond herd immunity
地址: http://arxiv.org/abs/2207.03462
作者: Javier Aguilar, Raúl Toral, Sandro Meloni, Jose J. Ramasco
摘要: 理解流行病传播模型背后的复杂性对于达到对传播模式进行可靠预测的程度具有重要意义。在最近的 COVID-19 大流行中,随着预防措施的实施和放松,我们在一系列流行高峰期提供了帮助。然而,即使在第一波最严格的居家隔离措施刚解除后,新病例的数量仍然很低,但非零。以前的一些作品甚至将这个政权视为批评家。受这种现象的启发,我们在这里研究了一个元种群框架中的典型易感感染恢复 (SIR) 模型,其中感染个体从水库流入。专注于这种外部播种是如此之小以至于无法从流行曲线分析中检测到的制度,我们发现有限持续时间的爆发会及时渗透,导致广泛参数区域的整体流行状态。使用局部动力学的两态描述,我们能够提取相空间的分析预测。主要发现适用于各种流行病和流动性模型、连接亚群和人口分布的网络拓扑。虽然我们在这里专注于掌握这一现象背后的基本机制,但这些地方性国家存在的后果可以立即转化为应用程序和流行病预测。
转自:网络科学研究速递
如有侵权,请联系本站删除!