CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于异配图神经网络的社交机器人检测
作者黄海涛
答辩日期2024-05-18
文献子类硕士
关键词社交机器人检测 图神经网络 异配性 相容性 图自监督学习
英文摘要

随着社交媒体的快速发展,社交机器人日益泛滥。这些社交机器人可能引发经济损失、操纵舆论环境甚至危害政治稳定。由于人类用户在识别社交机器人方面能力有限,故检测社交机器人的自动化算法已成为研究人员的重点关注领域。而在社交机器人检测算法领域,基于图神经网络 (Graph Neural Network, GNN) 的检测算法因其优异的检测性能和鲁棒性而备受青睐。这类方法利用GNN编码器,以端到端的方式将用户特征信息和网络结构信息融合起来,可以有效地提升两类用户表示的区分度,从而提升算法在社交机器人检测方面的表现。

然而,现有的基于GNN的社交机器人检测方法仍然存在网络结构信息利用不充分和不恰当的问题,从而造成这些方法在检测效率、检测性能和标签依赖性方面仍有较大的提升空间。因此,本文对基于GNN构建的社交机器人检测方法展开研究,分别提出利用异配图神经网络 (Graph Neural Network with Heterophily, GNNH) 捕捉网络中的异配现象以提升检测效率,通过建模用户间异质相容性来表征用户多样化的邻居偏好以提升检测性能,以及利用图自监督学习方法预训练编码器来降低检测算法的标注数据依赖性。

本论文的主要研究贡献包括:

  1. 针对现有的基于GNN的检测方法不能捕捉网络中异配现象造成的检测效率低下问题,本文提出利用GNNH捕捉网络中的异配现象。通过引入异配视角,本文得以确认网络中的异配现象对检测算法的性能存在显著影响。据此视角,本文筛选高效的GNNH模型,以构建能够捕捉异配现象的检测算法,避免异类邻居对用户最终表示和检测算法性能造成干扰,从而以简单高效的检测模型实现较好的检测性能。在三个常用的社交机器人检测数据集上,本文的方法取得了与当前最优 (state-of-the-art, SOTA) 方法相似的检测性能,同时其参数规模仅为SOTA方法的约1%,训练耗时仅为SOTA方法的约5%,具有极高的检测效率。
  2. 针对现有的基于GNN的检测方法不能捕捉用户多样化的邻居偏好造成的检测性能受限问题,本文提出通过学习用户间的异质相容性函数来建模用户间异质关联关系。通过引入异质相容性视角,本文得以将用户多样化的邻居偏好描述成邻居用户间异质关联关系。在此基础上,本文提出通过学习用户间的异质相容性函数来增强网络捕捉多样邻居偏好的能力,并以此构建出异质相容性感知的社交机器人检测算法。在三个常用的社交机器人检测数据集上,提出的方法在检测性能方面显著优于现有SOTA方法,同时其参数规模仅为SOTA方法的约2%,训练耗时仅为SOTA方法的约10%

针对现有的基于GNN的检测方法严重依赖于标注数据的问题,本文通过筛选能够适应社交网络用户多样化邻居偏好的图自监督学习方法,提出一种基于图自监督学习的社交机器人检测方法。这种方法将特征自编码器和图掩码自编码器结合起来,先以自监督方式预训练编码器,再以参数冻结微调的方式检测社交机器人。在两个常用社交机器人检测数据集上,在标注用户比例极低的情况下,本文提出的方法在检测性能方面优于当前的SOTA方法,能够缓解基于GNN的检测方法对已标注用户数据的依赖性。

语种中文
页码85
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/58518]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
黄海涛. 基于异配图神经网络的社交机器人检测[D]. 2024.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace