投稿问答最小化  关闭

万维书刊APP下载

Arxiv网络科学论文摘要15篇(2022-03-22)

2022/3/24 9:10:56  阅读:164 发布者:chichi77

揭示多元时间序列的高阶组织;

元权重图神经网络:超越全局同质性的极限;

表征 YouTube 上的替代获利策略;

Subreddit 链接推动 Reddit 上的社区创建和用户参与;

具有认知行为不对称的记忆社会网络中的成本函数学习;

互联网观测站和前哨站的时间相关性;

多通道 CNN 使用混合特征对尼泊尔 covid-19 相关推文进行分类;

社交媒体网络中阿尔及利亚滥用者的在线行为;

基辅bylyny周期的网络分析——东斯拉夫史诗叙事;

使用机器学习和标头信息进行电子邮件异常检测;

谁将在 Twitter 上分享假新闻?在线帖子历史中的心理语言线索区分错误信息生态系统中的参与者;

模拟 COVID-19 传播的扩散反应隔室模型的适定性;

多极社会系统:超越二分法背景测量两极分化;

MTBF-33:美国 33 个县的多时态建筑足迹数据集(1900-2015;

SETI、演化和人类历史合并成一个数学模型;

揭示多元时间序列的高阶组织

原文标题: Unveiling the higher-order organization of multivariate time series

地址: http://arxiv.org/abs/2203.10702

作者: Andrea Santoro, Federico Battiston, Giovanni Petri, Enrico Amico

摘要: 时间序列分析已被证明是一种强有力的方法来描述生物、神经和社会经济系统中的几种现象,并理解它们的潜在动态特征。尽管已经提出了大量用于分析多变量时间序列的方法,但它们中的大多数都没有研究信号是否来自独立、成对或组交互。在这里,我们提出了一个新的框架来描述多变量时间序列中高阶依赖项的时间演化。使用网络分析和拓扑,我们表明,与传统工具不同,我们的框架稳健地区分了耦合混沌映射的各种时空机制,包括混沌动态相位和各种类型的同步。通过分析 fMRI 信号,我们发现,在休息期间,人脑主要在混沌状态和少数部分间歇状态之间振荡,具有反映感觉运动区域的高阶结构。同样,在金融和流行病时间序列中,高阶信息有效地区分完全不同的协调和传播机制。总体而言,我们的方法为多元时间序列的高阶组织提供了新的思路,从而可以更好地表征现实世界系统固有的动态组依赖关系。

元权重图神经网络:超越全局同质性的极限

原文标题: Meta-Weight Graph Neural Network: Push the Limits Beyond Global Homophily

地址: http://arxiv.org/abs/2203.10280

作者: Xiaojun Ma, Qin Chen, Yuanyi Ren, Guojie Song, Liang Wang

摘要: 图神经网络 (GNN) 通过聚合来自邻居的信息并在下游任务中使用集成表示,在图数据挖掘方面显示出强大的表达能力。图中每个节点的相同聚合方法和参数用于使 GNN 能够利用同质关系数据。然而,并不是所有的图都是同质的,即使在同一个图中,分布也可能有很大的不同。在所有节点上使用相同的卷积可能会导致对各种图模式的无知。此外,许多现有的 GNN 将节点特征和结构相同地集成在一起,忽略了节点的分布,进一步限制了 GNN 的表达能力。为理解决这些问题,我们提出了元权重图神经网络(MWGNN)来为不同的节点自适应地构建图卷积层。首先,我们使用元权重从节点特征、拓扑结构和位置标识方面对节点局部分布(NLD)进行建模。然后,基于元权重,我们生成自适应图卷积以执行特定于节点的加权聚合并提升节点表示。最后,我们在现实世界和综合基准上设计了大量实验,以评估 MWGNN 的有效性。这些实验表明 MWGNN 在处理具有各种分布的图数据方面具有出色的表达能力。

表征 YouTube 上的替代获利策略

原文标题: Characterizing Alternative Monetization Strategies on YouTube

地址: http://arxiv.org/abs/2203.10143

作者: Yiqing Hua, Manoel Horta Ribeiro, Robert West, Thomas Ristenpart, Mor Naaman

摘要: YouTube 平台的主要新兴角色之一是为创作者提供从内容和互动中创收的能力。除了平台直接提供的工具(例如广告收入分享)外,创作者还可以选择该平台来利用各种平台外货币化机会。在这项工作中,我们专注于研究和描述这些替代货币化策略。利用流行创作者的大型纵向 YouTube 数据集,我们开发了替代货币化策略的分类和自动检测其使用情况的简单方法。然后,我们继续描述这些策略的采用。首先,我们发现外部货币化的使用越来越广泛,并且越来越普遍,18% 的视频使用了这种策略,61% 的频道至少使用了一次这样的策略。其次,我们表明,这些策略的采用在不同类型和受欢迎程度的渠道之间存在很大差异,并且建立这些替代收入流的渠道通常在平台上变得更有效率。最后,我们调查了可能存在问题的渠道——那些产生 Alt-liteAlt-right Manosphere 内容的渠道——如何利用替代货币化策略,发现它们采用更多样化的此类策略的频率明显高于精心选择的比较套频道。这一发现使 YouTube 作为看门人的角色变得复杂,因为将违反政策的内容排除在其原生平台货币化之外的做法可能无效。总体而言,这项工作为加深对 YouTube 内容创作背后的金钱激励的理解迈出了重要的一步。

Subreddit 链接推动 Reddit 上的社区创建和用户参与

原文标题: Subreddit Links Drive Community Creation and User Engagement on Reddit

地址: http://arxiv.org/abs/2203.10155

作者: Rachel Krohn, Tim Weninger

摘要: Reddit 上,单独的 subreddit 用于组织内容和连接用户。一种交互模式是 subreddit 链接,当用户直接引用另一个社区中的 subreddit 时会发生这种情况。基于这些参考资料的普遍性,我们对 Reddit 上的 subreddit 链接进行了研究,目的是理解它们对引用的 subreddit 以及整个 subreddit 格局的影响。通过广泛的观察研究以及使用 Reddit 整个历史的几个自然实验,我们能够确定 (1) subreddit 链接是新 suberddit 创建的重要驱动力; (2) subreddit 链接 (2a) 极大地推动了引用的 subreddit 中的活动,以及 (2b) 经常创建以响应引用的 subreddit 中的高水平活动; (3) 随着时间的推移,subreddit 链接的图变得不那么密集,更像树。最后,我们讨论了这些结果如何证实、补充并在某些情况下与在线社交系统中关于信息寻求行为和自组织行为的现有理论相冲突。

具有认知行为不对称的记忆社会网络中的成本函数学习

原文标题: Cost Function Learning in Memorized Social Networks with Cognitive Behavioral Asymmetry

地址: http://arxiv.org/abs/2203.10197

作者: Yanbing Mao, Jining Li, Naira Hovakimyan, Tarek Abdelzaher, Christian Lebiere

摘要: 本文研究了社会信息网络中的成本函数学习,其中明确考虑了人类记忆对信息消费的影响。我们首先提出了一个社会信息扩散动力学模型,重点是不对称认知偏差的系统建模,以确认偏差和新颖性偏差为代表。在所提出的社会模型的基础上,我们提出了 M^3IRL:一种基于模型和最大熵的逆强化学习框架,用于学习记忆社会网络中目标个体的成本函数。与现有的贝叶斯 IRL、最大熵 IRL、相对熵 IRL 和最大因果熵 IRL 相比,这里 M^3IRL 的特性有很大不同:不依赖于马尔可夫决策过程原理,只需要一个单个有限时间轨迹样本和有界决策变量。最后,通过在线社交媒体数据验证了所提出的社交信息扩散模型和 M^3IRL 算法的有效性。

互联网观测站和前哨站的时间相关性

原文标题: Temporal Correlation of Internet Observatories and Outposts

地址: http://arxiv.org/abs/2203.10230

作者: Jeremy Kepner, Michael Jones, Daniel Andersen, Aydın Buluç, Chansup Byun, K Claffy, Timothy Davis, William Arcand, Jonathan Bernays, David Bestor, William Bergeron, Vijay Gadepally, Daniel Grant, Micheal Houle, Matthew Hubbell, Hayden Jananthan, Anna Klein, Chad Meiners, Lauren Milechin, Andrew Morris, Julie Mullen, Sandeep Pisharody, Andrew Prout, Albert Reuther, Antonio Rosa, Siddharth Samsi, Doug Stetson, Charles Yee, Peter Michaleas

摘要: 互联网已成为现代文明的重要组成部分,需要类似于努力理解陆地、海洋、空中和太空环境的科学探索。理解流量的基线统计分布对于科学理解 Internet 至关重要。关联来自不同 Internet 观测站和前哨站的数据可能是深入理解这些分布的有用工具。这项工作将来自最大的互联网望远镜(CAIDA 暗网望远镜)的观测源与来自商业前哨站(GreyNoise 蜂蜜农场)的观测源进行了比较。这些位置都不会主动发出 Internet 流量,也不会提供对未经请求的 Internet 流量(主要是僵尸网络和扫描仪)的独特观察。新开发的 GraphBLAS 超空间矩阵和 D4M 关联阵列技术能够在显著尺度上对这些数据进行有效分析。 CAIDA 来源很好地近似为 Zipf-Mandelbrot 分布。在 6 个月的时间里,CAIDA 望远镜中 70% 的最亮(最高频率)光源一直被 GreyNoise 蜜场的同时期观测所探测到。随着源变暗(降低频率)和观察之间的时间差增加,这种重叠会下降。看到 CAIDA 源的概率与亮度的对数成正比。时间相关性可以通过修改后的柯西分布很好地描述。这些观察结果与在一个月的时间尺度上漂移的相关高频源束一致。

多通道 CNN 使用混合特征对尼泊尔 covid-19 相关推文进行分类

原文标题: Multi-channel CNN to classify nepali covid-19 related tweets using hybrid features

地址: http://arxiv.org/abs/2203.10286

作者: Chiranjibi Sitaula, Tej Bahadur Shahi

摘要: 由于当前的 COVID-19 大流行,人们越来越担心,它引发了多种健康并发症,例如抑郁和焦虑。这种复杂情况不仅影响了发达国家,也影响了尼泊尔等发展中国家。这些复杂性可以从人们在适当的分析和情绪分类后在线发布的推文/评论中理解。然而,由于每条推文中的标记/单词数量有限,因此刻画与它们相关的多个信息以更好地理解它们总是至关重要的。在这项研究中,我们首先通过结合句法和语义信息来表示每条推文,称为混合特征。句法信息是从词袋方法生成的,而语义信息是从基于 fastText (ft) 和特定领域 (ds) 方法的组合中生成的。其次,我们设计了一种新颖的多通道卷积神经网络 (MCNN),它集成了多个 CNN,以刻画多尺度信息以进行更好的分类。最后,我们评估了所提出的特征提取方法和 MCNN 模型在 NepCOV19Tweets 数据集上将推文分类为三个情感类别(正面、中性和负面)的效果,这是尼泊尔语中唯一的公共 COVID-19 推文数据集。评估结果表明,所提出的混合特征优于单个特征提取方法,最高分类准确率为 69.7%MCNN 模型在分类过程中优于现有方法,最高分类准确率为 71.3%

社交媒体网络中阿尔及利亚滥用者的在线行为

原文标题: The Online Behaviour of the Algerian Abusers in Social Media Networks

地址: http://arxiv.org/abs/2203.10369

作者: Kheireddine Abainia

摘要: 连接到社交媒体网络成为全世界大多数人的日常任务,共享信息的数量呈指数级增长。因此,控制人们交流的方式是必要的,以保护他们免受迷失方向、冲突、攻击等。在本文中,我们对社交媒体(即 Facebook)中的网络欺凌和辱骂内容进行了统计研究),我们试图在其中发现阿尔及利亚社区中施虐者的在线行为。更具体地说,我们在 600 名中涉及来自不同地区的 200 Facebook 用户来进行这项研究。这项调查的目的是帮助滥用检测的自动系统通过整合在线活动来做出决定。滥用检测系统需要大量数据才能在此类文本(即非结构化和非正式文本)上表现更好,这是由于缺乏标准的正字法,那里有各种阿尔及利亚方言和语言。

基辅bylyny周期的网络分析——东斯拉夫史诗叙事

原文标题: Network analysis of the Kyiv bylyny cycle east Slavic epic narratives

地址: http://arxiv.org/abs/2203.10399

作者: Petro Sarkanych, Nazar Fedorak, Yurij Holovatch, Pádraig MacCarron, Joseph Yose, Ralph Kenna

摘要: 1960 年代约瑟夫·坎贝尔的开创性工作以来,普遍性成为比较神话领域中一个重要的定性概念。最近,网络科学的出现为文学研究提供了新的定量方法。在这里,我们将 Kyiv bylyny 循环带入该领域——起源于现代乌克兰的东斯拉夫史诗叙事。通过将它们与其他著名的欧洲史诗进行比较,我们确定了 bylyny 中社会网络的普遍性和显著性。我们分析社区结构并对最重要的人物进行排名。该方法允许支持来自人文文学的假设——例如沃拉迪米尔王子的太阳位置——并产生新的假设。我们展示了 bylyny 的基辅循环如何与来自其他国家的叙事网络非常吻合——尤其是英雄网络。我们预计,除了提供新的叙事学见解外,这项研究还将帮助未来的学者和感兴趣的公众理解乌克兰的史诗故事并确定其英雄。

使用机器学习和标头信息进行电子邮件异常检测

原文标题: Anomaly Detection in Emails using Machine Learning and Header Information

地址: http://arxiv.org/abs/2203.10408

作者: Craig Beaman, Haruna Isah

摘要: 网络钓鱼和垃圾邮件等电子邮件异常会给个人和组织带来重大的安全风险,例如隐私、金钱和品牌声誉的损失。以前关于电子邮件异常检测的研究依赖于单一类型的异常以及对电子邮件正文和主题内容的分析。这种方法的一个缺点是它考虑了电子邮件内容的书面语言。为了克服这一缺陷,本研究对电子邮件标题数据集进行了特征提取和选择,并利用了多类和一类异常检测方法。获得的实验分析结果表明,仅电子邮件标头信息就足以可靠地检测垃圾邮件和网络钓鱼电子邮件。随机森林、SVMMLPKNN 等监督学习算法及其堆叠集成非常成功,网络钓鱼和垃圾邮件的准确率分别达到 97% 99%。使用 One-Class SVM 进行的一类分类在垃圾邮件和网络钓鱼电子邮件中的准确率分别为 87% 89%。在资源利用和效率方面,现实世界的电子邮件过滤应用程序将受益于仅使用标题信息。

谁将在 Twitter 上分享假新闻?在线帖子历史中的心理语言线索区分错误信息生态系统中的参与者

原文标题: Who will share Fake-News on Twitter? Psycholinguistic cues in online post histories discriminate Between actors in the misinformation ecosystem

地址: http://arxiv.org/abs/2203.10560

作者: Verena Schoenmueller, Simon J. Blanchard, Gita V. Johar

摘要: 错误信息或假新闻的传播是一个全球性问题,破坏了在保护民主和公共卫生等问题上的进展。过去旨在打击其传播的研究主要集中在识别其语义内容和发布此类新闻的媒体上。相比之下,我们旨在通过研究假新闻生态系统中参与者的语言(如假新闻分享者、事实核查分享者和随机推特用户)来识别更有可能分享假新闻的个人,并创建一个他们的语言特征。假新闻分享者和事实核查分享者在他们的语言中使用明显更多的高唤醒负面情绪,但假新闻分享者比其他参与者表达更多基于存在的需求。将从他们的推文中推断出的心理语言线索纳入社会人口预测模型,大大提高了假新闻分享者的分类准确性。假新闻分享者在重要方面与假新闻生态系统中的其他参与者不同(例如他们的生存需求),但在其他方面也与他们相似(例如他们的愤怒程度),这一发现突出了重要性研究整个假新闻生态系统以提高识别和预测的准确性。我们的方法可以通过使平台能够先发制人地筛选潜在的假新闻分享者的帖子来帮助减少假新闻分享。

模拟 COVID-19 传播的扩散反应隔室模型的适定性

原文标题: Well-posedness for a diffusion-reaction compartmental model simulating the spread of COVID-19

地址: http://arxiv.org/abs/2203.10869

作者: Ferdinando Auricchio, Pierluigi Colli, Gianni Gilardi, Alessandro Reali, Elisabetta Rocca

摘要: 本文关注易感-暴露-感染-恢复 (SEIR) 数学模型的扩散反应系统的适定性。该模型是根据具有非线性扩散的四个非线性偏微分方程编写的,具体取决于 SEIR 种群的总量。该模型旨在描述 COVID-19 大流行的时空传播,是最近在 [A. Viguerie 等人,在连续体力学框架中制定的扩散反应隔室模型:应用于 COVID-19、数学分析和数值研究,Comput。机甲。 66 (2020) 1131-1152]。在这里,我们处理由此产生的 Cauchy-Neumann 问题的数学分析:在相当一般的设置中证明理解的存在性,并采用了合适的时间离散化程序。值得一提的是,离散解的一致有界性是通过仔细利用系统的结构来展示的。关于时间步长的统一估计和通过极限允许完成存在性证明。然后,结合解的规律性结果,给出了两个唯一性定理,一个在恒定扩散系数的情况下,另一个用于更规则的数据。

多极社会系统:超越二分法背景测量两极分化

原文标题: Multipolar social systems: Measuring polarization beyond dichotomous contexts

地址: http://arxiv.org/abs/2203.10870

作者: Samuel Martin-Gutierrez, Juan C. Losada, Rosa M. Benito

摘要: 社会两极分化在世界范围内日益受到关注,因为它使社会关系紧张,削弱对制度的信任,从而威胁到民主社会。理解这一现象的学术努力传统上从一维的角度来处理它,重点是双极或二分系统。然而,政治冲突往往不仅涉及两个,而且涉及多个可能持不同意见的派别。最具代表性的例子是多党民主国家,多党之间的多边紧张局势往往导致僵局和不确定性。尽管这些多极系统很普遍,但仍然缺乏合适的分析工具来研究其复杂的极化模式。在这项工作中,我们开发了一个分析框架,该框架由一个固有的无偏见意识形态空间的多极模型、一种从交互网络推断多维观点的方法,以及量化意识形态极化的几个方面并为分析的新见解的新的多维极化度量组成。高维意见分布。至关重要的是,我们的多维框架并没有假设潜在的意识形态结构,例如保守与进步、自由与专制等。相反,它揭示了最能描述社会景观的自然空间,这不一定与传统类别相对应。我们说明了该框架在四极和五极现实世界民主进程中的应用,发现了与潜在社会背景有明确联系的非平凡意识形态结构。我们的方法提供了多边社会紧张局势的综合视角,因为它包含了两极分化的互补方面:网络隔离、意见极端化和问题一致性。

MTBF-33:美国 33 个县的多时态建筑足迹数据集(1900-2015

原文标题: MTBF-33: A multi-temporal building footprint dataset for 33 counties in the United States (1900-2015)

地址: http://arxiv.org/abs/2203.11078

作者: Johannes H. Uhl, Stefan Leyk

摘要: 尽管当代人类住区空间分布数据丰富,但精细时空粒度的人类住区长期演化历史数据却很少,限制了我们对建成区长期变化的定量认识。这是因为常用的制图方法(例如图像分类)和合适的数据源(例如航空影像、多谱遥感数据、激光雷达)直到最近几十年才出现。但是,还有其他数据源,例如数字可用的地籍记录,其中包含建筑物年龄信息等相关信息,允许对过去的建筑物分布进行近似的数字重建。我们对美国行政机构的开放和公开可用数据资源进行了非详尽搜索,并收集、整合和协调了 33 个县的地籍地块数据、税收评估数据和建筑足迹数据,这些县的建筑足迹几何形状和建筑施工年份信息可用。这项工作的结果是一个独特的数据集,我们称之为美国 33 个县的多时态建筑足迹数据集 (MTBF-33)MTBF-33 包含超过 620 万个建筑足迹,包括其建造年份,可用于以精细的空间和时间粒度对 1900 年至 2015 年的建成区进行回顾性描述,并可用于数据验证目的,或用于训练旨在从遥感数据、历史地图或类似数据源中提取人类住区历史信息的统计学习方法。 MTBF-33 可在此 http URL 获得

SETI、演化和人类历史合并成一个数学模型

原文标题: SETI, evolution and human history merged into a mathematical model

地址: http://arxiv.org/abs/2203.10116

作者: Claudio Maccone

摘要: 在本文中,我们提出了一种新的数学模型,能够将达尔文演化论、人类历史和 SETI 合并为一个数学方案:1)过去 35 亿年的达尔文演化论被定义为特定随机过程的一个特定实现,称为几何布朗运动(GBM)。这个 GBM 产生了生活在地球上的物种数量的时间波动。它的均值曲线是一条递增的指数曲线,即演化的指数增长。 2) 2008 年,作者提供了 Drake 方程的统计概括,得出银河系中交流的 ET 文明的数量 N。显示 N 遵循对数正态概率分布。 3)我们称“b-lognormals”那些从大于零的任何正时间 b(“出生”)开始的对数正态。然后指数增长曲线变成了单参数 b 对数正态的峰值的几何轨迹:这是我们重新定义 Cladistics 的方式。 4) b-lognormals 也可以解释为任何生物(细胞、动物、植物、人类,甚至任何文明的历史寿命)的寿命。将这种新的数学工具应用于人类历史,导致发现古希腊和当前美国之间的指数级进步是 2500 年来西方文明所有 b 对数正态的包络。 5)然后我们调用香农的信息论。 b-lognormals的熵原来是每个历史文明达到的“发展水平”的指标。因此,我们得到了任何两个文明之间熵差异的数值估计,例如 1519 年的阿兹特克-西班牙差异。 6) 总之,我们推导出了一个数学方案,能够估计外星文明比人类先进多少。 SETI 的科学家们将发现关于外星人的第一个线索。

如有侵权,请联系本站删除!

  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com