投稿问答最小化  关闭

万维书刊APP下载

Arxiv网络科学论文摘要15篇(2022-11-03)

2022/11/8 15:47:00  阅读:190 发布者:

定制的顶点排序,用于在大图中更快地列出三角形;

缺失数据插补对图节点分类器公平性和准确性的影响;

银团网络对风险投资公司专业化和绩效的影响;

DeepTrace:学习使用图神经网络优化流行病网络中的接触者追踪;

重叠加权网络中的社区检测;

二分混合成员无分布模型。一种用于重叠二分加权网络中社区检测的新模型;

输电网络中N-1应急约束的基于拓扑的近似;

多尺度碳化反应:与文化遗产相关的事物现状和两个建模练习;

高阶演化网络的时间拓扑特性;

Tournesol:具有安全保证的无许可协作算法治理;

FiFo:大规模物联网网络中的鱼骨转发;

通过基尼指数观察临界尺度;

评估高管社交媒体帖子对股价的影响;

哥本哈根 Dybbolsbro 路口骑车人的计算愿望线分析;

使用基于指标的模型检测人工智能科学生态系统中的新兴技术;

定制的顶点排序,用于在大图中更快地列出三角形

原文标题: Tailored vertex ordering for faster triangle listing in large graphs

地址: http://arxiv.org/abs/2203.04774

作者: Fabrice Lécuyer, Louis Jachiet, Clémence Magnien, Lionel Tabourier

摘要: 列出三角形是许多应用程序的基本图问题,大型图需要快速算法。顶点排序允许边的方向从较低的顶点索引到较高的顶点索引,并且最先进的三角形列表算法使用它来加速它们的执行并限制它们的时间复杂度。然而,只测试了基本的排序。在本文中,我们展示了研究算法的精确成本而不是它们的有限复杂性会导致更快的解决方案。我们引入了将排序属性与给定算法的运行时间联系起来的成本函数。我们证明了它们的最小化是 NP 难的,并提出启发式方法来获得新的订单,并在成本降低和订购时间之间进行不同的权衡。使用具有多达 20 亿条边的数据集,我们表明,当已经将排序作为输入给出时,我们的启发式算法将三角形列表平均加速了 38%,当包括排序时间时,加速了 16%

缺失数据插补对图节点分类器公平性和准确性的影响

原文标题: Impact Of Missing Data Imputation On The Fairness And Accuracy Of Graph Node Classifiers

地址: http://arxiv.org/abs/2211.00783

作者: Haris Mansoor, Sarwan Ali, Shafiq Alam, Muhammad Asad Khan, Umair ul Hassan, Imdadullah Khan

摘要: 机器学习(ML)算法的公平性分析最近引起了许多研究人员的兴趣。大多数 ML 方法显示出对受保护群体的偏见,这限制了 ML 模型在犯罪率预测等许多应用中的适用性。因为数据可能有缺失值,如果处理不当,已知会进一步有害地影响公平性。提出了许多插补方法来处理缺失数据。然而,缺失数据插补对公平性的影响尚未得到很好的研究。在本文中,我们使用不同的嵌入和神经网络方法分析了在图数据(节点属性)插补上下文中对公平性的影响。对六个数据集的广泛实验表明,在图节点分类下缺失数据插补存在严重的公平性问题。我们还发现,插补方法的选择会影响公平性和准确性。我们的结果为图数据公平性以及如何有效处理图中的缺失提供了宝贵的见解。这项工作还为图数据公平性的理论研究提供了方向。

银团网络对风险投资公司专业化和绩效的影响

原文标题: Effects of syndication network on specialisation and performance of venture capital firms

地址: http://arxiv.org/abs/2211.00873

作者: Qing Yao, Shaodong Ma, Jing Liang, Kim Christensen, Wanru Jing, Ruiqi Li

摘要: 中国风险投资 (VC) 市场是一个年轻且发展迅速的金融子行业。更深入地理解风险投资公司的投资行为对于发展更可持续、更健康的市场和经济至关重要。对比证据支持专业化或多元化有助于实现更好的投资业绩。然而,辛迪加网络的影响却被忽视了。辛迪加网络对信息的传播和信任有很大的影响。通过利用中国35年投资信息的权威风险投资数据集,我们构建了风险投资公司的联合投资网络,并分析了联合和多元化对专业化和投资绩效的影响。风险投资公司的联合网络程度和专业化水平之间存在明显的相关性,这意味着连接良好的风险投资公司是多元化的。更多的联系通常会带来更多的信息或其他资源,与随机零模型相比,风险投资公司更有可能与一些新的共同投资的风险投资公司进入一个新的阶段或行业。此外,联合网络上专业化和成功率的自相关分析表明,类似风险投资公司的集群大致局限于次要社区。在分析本地集群模式时,我们发现,与流行的看法相反,没有明显成功的投资者俱乐部。相比之下,成功率低的投资者更有可能聚集在一起。我们的发现丰富了对风险投资行为的理解,可以帮助政策制定者设计更好的策略来促进风险投资行业的发展。

DeepTrace:学习使用图神经网络优化流行病网络中的接触者追踪

原文标题: DeepTrace: Learning to Optimize Contact Tracing in Epidemic Networks with Graph Neural Networks

地址: http://arxiv.org/abs/2211.00880

作者: Siya Chen, Pei-Duo Yu, Chee Wei Tan, H. Vincent Poor

摘要: 数字接触者追踪的目标是通过使用数字技术检测和缓解突发公共卫生事件来减少流行病或大流行病的传播。自 COVID-19 美元大流行开始以来,已经部署了多种移动数字应用程序来识别暴露于 SARS-CoV-2 冠状病毒的人并阻止继续传播。正如在日本和澳大利亚所使用的那样,追踪传播源(即反向接触者追踪)已被证明至关重要,因为反向传播可能会发现在超级传播事件中可能会错过的感染。应该如何设计通过移动计算和网络分析自动化的强大的反向联系人跟踪?在本文中,我们将流行病源推断的前向和后向接触追踪问题表述为基于子图抽样的最大似然 (ML) 估计。除了已知完整感染拓扑的受限案例(受 Zaman Shah 2011 年的开创性工作的启发)之外,由于其绝对的组合复杂性、问题规模以及完整感染拓扑很少见的事实,一般问题更具挑战性准确地知道。我们提出了一个名为 DeepTrace 的图神经网络 (GNN) 框架,通过利用似然结构来计算 ML 估计量,以配置具有较小流行病网络的拓扑特征作为训练集的训练集。我们证明了我们的 GNN 方法的性能优于文献中先前的启发式方法,并作为设计强大的接触者追踪分析以对抗流行病的基础。

重叠加权网络中的社区检测

原文标题: Community detection in overlapping weighted networks

地址: http://arxiv.org/abs/2211.00894

作者: Huan Qing

摘要: 在过去十年中,节点可以属于多个社区的重叠未加权网络中的社区检测是现代网络科学中最受欢迎的主题之一。然而,在邻接矩阵的元素可以是任何有限实值的重叠加权网络中的社区检测仍然是一个挑战。在本文中,我们提出了一种度校正混合隶属度无分布 (DCMMDF) 模型,该模型将度校正混合隶属度模型从重叠未加权网络扩展到重叠加权网络。我们通过应用谱算法解决了 DCMMDF 的社区成员估计问题,并建立了估计一致性的理论保证。所提出的模型适用于模拟数据和真实世界数据。

二分混合成员无分布模型。一种用于重叠二分加权网络中社区检测的新模型

原文标题: Bipartite Mixed Membership Distribution-Free Model. A novel model for community detection in overlapping bipartite weighted networks

地址: http://arxiv.org/abs/2211.00912

作者: Huan Qing

摘要: 近年来,对节点可以属于多个社区的无向无权网络的混合成员资格进行建模和估计已经得到了很好的研究。然而,对于更一般的情况,二分加权网络中的节点可以属于多个社区,行节点可以不同于列节点,并且邻接矩阵的所有元素可以是任何有限的实数值,据我们所知,没有这种二分加权网络的模型。为了弥补这一差距,本文介绍了一种新颖的模型,即二部混合成员无分布 (BiMMDF) 模型。作为一种特殊情况,具有混合成员资格的双向符号网络也可以从 BiMMDF 生成。我们的模型通过允许从任何分布生成邻接矩阵的所有元素来享受其优势,只要期望邻接矩阵具有与 BiMMDF 下的节点成员资格相关的块结构。所提出的模型可以看作是许多先前模型的扩展,包括流行的混合成员随机 blcok 模型。应用具有一致性估计理论保证的有效算法来拟合 BiMMDF。特别是对于具有两个行(和列)社区的标准二分加权网络,为了使算法的错误率高概率地小,在BiMMDF下从不同分布生成邻接矩阵时获得分离条件。通过在 BiMMDF 下生成的广泛的合成二分加权网络验证了不同分布在分离条件下的行为差异。现实世界有向加权网络的实验说明了该算法在研究高度混合节点和行和列社区之间的不对称性方面的优势。

输电网络中N-1应急约束的基于拓扑的近似

原文标题: Topology-based Approximations for N-1 Contingency Constraints in Power Transmission Networks

地址: http://arxiv.org/abs/2211.00970

作者: Amin Shokri Gazafroudi, Fabian Neumann, Tom Brown

摘要: 即使单条线路出现故障,传输网络仍能继续运行对于维持供电安全至关重要。如果考虑到所有可能的中断,对电力系统容量扩展问题中的 mathcalN - 1 安全性建模会引入许多额外的约束,这会导致计算负担很高。避免这种负担的典型方法只考虑与给定调度情况相关的可能中断的子集。但是,这依赖于事先理解调度情况,不适合事先不知道发电车队的投资优化问题。在本文中,我们介绍了一种启发式方法,以仅依赖于传输网络拓扑的方式使用较少数量的约束对完全安全的 mathcalN-1 可行空间进行建模。在我们提出的方法中,网络的安全性是通过比较从安全约束的线性化交流最优潮流问题中获得的节点净功率的可行空间的多面体来建模的。为了近似这个多面体,在 mathcalN-0 安全情况下为传输线定义了一个缓冲容量因子,从而避免引入许多额外的约束。以这种方式,引入了三种方法来获得由近似的、稳健的和特定于线路的方法组成的缓冲容量因子。最后,我们在不同规模的输电网络中评估了我们提出的方法的性能,以确定提出的缓冲容量因子、应急分析和经济评估。此外,我们发现我们提出的启发式算法提供了完全安全的 mathcalN-1 解决方案的出色近似值,并且计算负担要低得多。

多尺度碳化反应:与文化遗产相关的事物现状和两个建模练习

原文标题: Multiscale carbonation reactions: Status of things and two modeling exercises related to cultural heritage

地址: http://arxiv.org/abs/2211.01081

作者: Adrian Muntean

摘要: 考虑到作为在文化遗产领域工作的目标受众初学者研究人员,我们简洁地提出了反应扩散问题的两尺度建模的概念,因为它适合与碳酸化反应的作用相关的场景。我们简要回顾了有关多尺度混凝土碳化过程的著名贡献,最后,我们指出了两个相关的多尺度建模练习。这些笔记的范围是双重的:推广多尺度建模的语言,我们邀请应用数学家从文化遗产的背景中挑选一些目标问题。另一方面,当实验室实验无法回答问题时,我们邀请实验家与应用数学家交谈,例如关于暴露于各种化学物质、湿度和/或温度(如城市地区的历史古迹和建筑物就是这种情况),因为建模和模拟方法至少可以提供有关一旦测量停止或感兴趣的情况实际发生在实验室外时可能进一步发生的情况的临时提示。

高阶演化网络的时间拓扑特性

原文标题: Temporal-topological properties of higher-order evolving networks

地址: http://arxiv.org/abs/2211.01128

作者: Alberto Ceria, Huijuan Wang

摘要: 人类社会互动通常被记录为特定时间的二元互动,并表示为不断发展的(时间)网络,其中链接随着时间的推移被激活/停用。但是,个人可以在超过两个人的群体中进行互动。这种群体交互可以表示为不断发展的网络的高阶事件。在这里,我们提出了表征高阶事件的时间拓扑特性的方法,以比较网络并识别它们的(不)相似性。我们分析了 8 个现实世界的物理接触网络,发现如下: b) 参与给定顺序的许多不同组(事件)的节点倾向于参与另一个顺序的许多不同组(事件);因此,个人倾向于在跨订单的事件中始终保持活跃或不活跃; c) 在拓扑上接近的局部事件在时间上是相关的,支持观察 a)。不同的是,在 5 个协作网络中,观察 a) 几乎不存在;一致地,在协作网络中没有观察到本地事件的明显时间相关性。与协作网络相比,这两类网络之间的这种差异可以通过物理接触是基于接近度的事实来解释。我们的方法可能有助于研究高阶事件的属性如何影响在它们上展开的动态过程,并可能激发开发更精细的高阶时变网络模型。

Tournesol:具有安全保证的无许可协作算法治理

原文标题: Tournesol: Permissionless Collaborative Algorithmic Governance with Security Guarantees

地址: http://arxiv.org/abs/2211.01179

作者: Romain Beylerian, Bérangère Colbois, Louis Faucon, Lê Nguyên Hoang, Aidan Jungo, Alain Le Noach, Adrien Matissart

摘要: 推荐算法在我们的社会中发挥着越来越重要的作用。然而,到目前为止,这些算法大多是由私人团体或政府当局单方面设计和参数化的。在本文中,我们提出了一种具有安全保证的端到端无许可协作算法治理方法。我们提出的方法被部署为开源内容推荐平台 https://tournesol.app 的一部分,该平台的推荐器由(非技术)贡献者社区协同参数化。这种算法治理是通过三个主要步骤实现的。首先,该平台包含一种将投票权分配给贡献者的机制。其次,该平台使用基于比较的模型来评估贡献者的个人偏好。第三,平台将所有贡献者的判断汇总为内容推荐的集体评分。我们强调,第一步和第三步容易受到恶意贡献者的攻击。为了保证抵御虚假账户的能力,第一步结合了电子邮件身份验证、担保机制、基于信誉的 EigenTrust 算法的新变体以及为太多不受信任的账户评分的替代方案的自适应投票权分配。为了提供针对恶意经过身份验证的贡献者的弹性,我们采用了 Mehestan,这是一种先前为鲁棒稀疏投票而提出的算法。我们相信,这些算法为协作、有效、可扩展、公平、贡献者友好、可解释和安全的治理提供了一个有吸引力的基础。最后,我们强调了使我们的解决方案适用于更大规模环境的关键挑战。

FiFo:大规模物联网网络中的鱼骨转发

原文标题: FiFo: Fishbone Forwarding in Massive IoT Networks

地址: http://arxiv.org/abs/2211.01213

作者: Hayoung Seong, Junseon Kim, Won-Yong Shin, Howon Lee

摘要: 海量物联网 (IoT) 网络具有广泛的应用,包括但不限于快速传递紧急和灾难消息。尽管迄今为止已经为此类应用中的消息传递开发了各种基准算法,但它们带来了一些实际挑战,例如网络覆盖不足和/或高度冗余的传输以扩大覆盖范围,导致每个物联网设备的能源消耗相当大。为了克服这个问题,我们首先描述了一个新的性能指标——转发效率,它被定义为覆盖概率与每个设备的平均传输次数之比,以更恰当地评估数据传播性能。然后,我们提出了一种新颖有效的转发方法,鱼骨转发(FiFo),旨在以可接受的计算复杂度提高转发效率。我们的 FiFo 方法完成了两个任务:1)它基于未加权对组方法和算术平均值对设备进行聚类; 2) 它使用高斯混合模型的期望最大化算法和主成分分析来创建每个集群的主轴和子轴。我们通过使用真实世界的数据集展示了 FiFo 的优越性。通过密集和全面的模拟,我们表明所提出的 FiFo 方法在转发效率方面优于基准算法。

通过基尼指数观察临界尺度

原文标题: Critical scaling through Gini index

地址: http://arxiv.org/abs/2211.01281

作者: Soumyaditya Das, Soumyajyoti Biswas

摘要: 在表现出临界行为的系统中,各种响应函数在临界点处具有奇异性,形式为 Msim |F-F_c|^-n。因此,M 的值随着驱动场 F 向其临界值 F_c 调整而急剧变化。在aF_c bF_c (0范围内m="" 值的不等式可以通过基尼指数g="" 来量化。我们证明对于="" n<1,基尼指数服从="" |f-f_c|sim="" |g-g_f|^1="" (1-n)="" 形式的尺度,其中="" g_f="g(" b="1)=n/(2-n)。这意味着" msim="" |g-g_f|^-n="" (1-n)。对于="" 1|f-f_c|="" sim="" n="">2, |F-F_c| sim |g-g_f|g_f=1,因此  Msim |g-g_f|^-n 。由于 g_f 要么仅仅是(通用)临界指数 n 的函数,要么是一个常数,因此上述关系有助于制定与(非通用)临界量无关的临界尺度行为,如 M系统的点。我们进一步展示了对于 n>1,另一个衡量不平等的指标——加尔各答指数 k,在 F_e点与基尼指数值一致。因此,这两个指数的重合性可以作为即将到来的临界点的关键指标。我们证明了这种前兆信号在纤维束模型中用于无序固体断裂的效用。这种方法可用于任何表现出临界行为的平衡或非平衡系统。|f-f_c|="">

评估高管社交媒体帖子对股价的影响

原文标题: Evaluating Impact of Social Media Posts by Executives on Stock Prices

地址: http://arxiv.org/abs/2211.01287

作者: Anubhav Sarkar, Swagata Chakraborty, Sohom Ghosh, Sudip Kumar Naskar

摘要: 预测股市走势一直是投资者的极大兴趣和活跃的研究领域。研究证明,产品的受欢迎程度很大程度上受人们谈论的内容的影响。 TwitterReddit 等社交媒体已成为此类影响的热点。本文使用 Twitter Reddit 帖子调查社交媒体帖子对股票收盘价预测的影响。我们的目标是将社交媒体数据的情绪与历史股票数据相结合,并使用时间序列模型研究其对收盘价的影响。我们使用多个基于深度学习的模型在不同的数据集上进行了严格的实验和深度分析,以研究高管和普通人的帖子对收盘价的影响。对多种股票(苹果和特斯拉)和去中心化货币(比特币和以太坊)的实验结果一致表明,在包括社交媒体数据方面的预测有所改进,在包括高管职位方面也有更大的改进。

哥本哈根 Dybbolsbro 路口骑车人的计算愿望线分析

原文标题: Computational Desire Line Analysis of Cyclists on the Dybbolsbro Intersection in Copenhagen

地址: http://arxiv.org/abs/2211.01301

作者: Simon Martin Breum, Bojan Kostic, Michael Szell

摘要: 当代街道设计优先考虑车辆交通流量,并假设道路使用者合规。然而,实际的人类行为通常被忽视,尤其是骑自行车的人,导致街道的寻路和车辆交通保护不足。为了改进规划,我们开发了一种计算方法来从视频记录中检测骑自行车者的轨迹,并将其应用于丹麦哥本哈根的 Dybbolsbro 十字路口。在一小时的镜头中,我们发现了数百条与设计相矛盾的轨迹,这可以解释为渴望直接、不间断的旅行,这在很大程度上不是由十字路口提供的。这种对车辆交通的忽视和优先考虑突出了改进丹麦交叉口设计的机会。

使用基于指标的模型检测人工智能科学生态系统中的新兴技术

原文标题: Detecting Emerging Technologies in Artificial Intelligence Scientific Ecosystem Using an Indicator-based Model

地址: http://arxiv.org/abs/2211.01348

作者: Ali Ghaemmaghami, Andrea Schiffauerova, Ashkan Ebadi

摘要: 由于其对社会的潜在影响,早期识别新兴主题非常重要。检测新兴术语和主题的方法有很多,各有优缺点。然而,出现的属性和指标没有达成共识。在这项研究中,我们使用一种新的方法来评估人工智能领域的新兴主题检测来评估新兴。我们还介绍了协作和技术影响的两个新属性,这可以帮助我们同时使用纸张和专利信息。我们的结果证实,所提出的新方法可以成功识别研究期间的新兴主题。此外,这种新方法可以为我们提供每个属性的分数和最终的出现分数,这使我们能够根据出现的分数和每个属性的分数对新兴主题进行排名。

转自:网络科学研究速递”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com