知识驱动的社会媒体虚假信息分析研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 模式识别国家重点实验室 > 多媒体计算与图形学团队

题名	知识驱动的社会媒体虚假信息分析研究
作者	张怀文
答辩日期	2021-05-29
文献子类	博士
授予单位	中国科学院大学
授予地点	中国科学院自动化研究所
导师	徐常胜
关键词	社会媒体虚假信息社会媒体数据挖掘知识驱动多模态
学位专业	模式识别与智能系统
英文摘要	网络社会媒体平台（online social media platforms）已经成为人们发布、传播和消费信息的最重要媒介之一。与传统媒体（广播、电视、报纸等）由权威机构发布信息不同，在社会媒体平台上，每天都有数以亿计的用户自发地发布和分享最新消息。然而，很少有用户会仔细检查他们所分享的信息的真实性，这意味着大量的虚假信息可能会在社会媒体平台出现和传播。这些社会媒体虚假信息（social media misinformation）意图以不实消息误导大众，从而获取政治、经济、心理等方面的利益，并已发展成为对政治工作、公众信任、媒体权威和市场经济的巨大威胁。开展社会媒体虚假信息分析研究，在净化网络空间环境、维护社会和谐稳定、保障国家信息安全等方面意义重大。社会媒体上的帖子（微博，推文等）具有文本短，模态多，噪声大等特点。因此社会媒体虚假信息分析技术，一般在建模社会媒体帖子内容的同时引入用户属性、传播结构等多种外部辅助信息，期望从中挖掘出有效的特征以准确快速地对虚假信息进行定位。在众多的辅助信息中，有一类较为特殊，即人们日常生活中沉淀的知识。例如，文字实体延伸的概念知识（concept）、写作文体所引申风格知识（style）、字里行间表达的立场知识（stance）等。这些知识是人类判别消息可信度的重要依据，它可以为社会媒体虚假信息分析算法提供丰富的辅助输入。本研究致力于将知识引入到社会媒体虚假信息分析方法中，对知识驱动的社会媒体虚假信息分析进行研究，利用人类的高维结构知识，提高对虚假信息的分析能力。本文的研究内容和主要贡献如下：一、研究应用于社会媒体数据的知识结构构建方法。知识驱动的社会媒体虚假信息分析的首要工作就是从社会媒体多模态数据中提取知识和知识结构。社会媒体平台上的帖子，一般文本长度较短并附有图片等多模态内容。为了从多模态的社会媒体语料中提取知识信息和知识结构，本文提出了变分深度图嵌入聚类方法，通过变分深度图嵌入方法刻画语料中的知识概念，并通过层次聚类方法归纳多模态知识结构。能够同时利用语料中的文本和视觉对应关系、上下文共现关系等因素，无监督地发现概念间的语义层次结构。模型可以从社会媒体语料中抽取知识信息和知识结构，构建多模态社会媒体信息知识图谱，为社会媒体虚假信息分析方法提供知识补充。二、研究概念知识感知的社会媒体虚假信息内容分析方法。现有的虚假信息检测方法倾向于从简短的消息文本中寻找线索，很大程度上忽略了高度浓缩的文字背后蕴含的丰富概念知识，而正是这些知识信息能够帮助人类验证虚假信息。本文提出了一种多模态知识感知事件记忆网络，能够从外部知识图谱中拓展社会媒体消息中隐含的背景知识，并通过同时建模文本、知识、图像以及事件特征，有效提升社会媒体虚假信息检测能力。其中多模态知识感知网络利用多模态社会媒体信息知识图谱，检索文本背后的丰富概念知识，并通过融合文本、视觉和知识特征，获取社会媒体消息的有效表示；事件记忆网络提取社会媒体消息中蕴含的事件不变特征，进一步提高模型的鲁棒性。三、研究风格知识解纠缠的社会媒体虚假信息文体分析方法。真实情况下的虚假信息分析算法总是面对新出现的、紧急的、没有标注数据的事件。而虚假信息往往与事件内容纠缠在一起。属于同一事件的两个虚假信息可能在文本和图像上有明显差异，属于不同事件的虚假信息其表述差异更大。本文提出了一种多模态解纠缠领域自适应方法，将多媒体帖子的特征空间解纠缠为事件内容空间和文体风格空间，并利用领域风格自适应算法将不同事件的文体风格知识进行对齐。删去了随事件变化的内容特征，专注于刻画可迁移的文体风格知识，算法可以训练得到鲁棒的社会媒体虚假信息检测器，它可以将从源事件中学习到的知识转移到目标事件中，并在检测新出现的事件时表现优异。四、研究立场知识辅助的社会媒体虚假信息受众分析方法。随着虚假信息的传播，对于该信息的支持、怀疑以及反对的回复（受众立场）会不断涌现。这些受众立场知识，可以作为判别信息可信度的重要指标。将立场检测任务中包含的有效知识特征引入到虚假信息分析任务中，可以有效提高虚假信息检测模型性能。本文提出了一种多模态元多任务学习方法，通过共享高层元知识网络，来刻画隐藏在两个任务背后的共享元知识，并以元知识为基础预测各个任务模型的参数。模型包含的注意力机制能精准吸收隐藏在细粒度立场标签中的语义知识，进一步提高模型的虚假信息检测能力。
语种	中文
页码	144
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/44801]
专题	自动化研究所_模式识别国家重点实验室_多媒体计算与图形学团队
推荐引用方式 GB/T 7714	张怀文. 知识驱动的社会媒体虚假信息分析研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2021.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们