基于深度神经网络的媒体转载行为分析研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 复杂系统管理与控制国家重点实验室 > 互联网大数据与安全信息学研究中心

题名	基于深度神经网络的媒体转载行为分析研究
作者	姚日恒
答辩日期	2020-05-30
文献子类	硕士
授予单位	中国科学院大学
授予地点	北京
导师	李秋丹
关键词	媒体转载行为深度神经网络转载预测转载识别群体分析
学位专业	社会计算
英文摘要	随着新一代信息技术的快速发展，新闻传播领域发生了革命性变化。在新媒体环境下，传播内容丰富且开放，传播过程迅速且交互性强。媒体间的转载行为是信息传播的主要方式之一，分析转载模式有助于管理部门及时跟踪舆论发展态势从而提供决策支持。本文旨在借鉴深度神经网络在网络表示学习、文本表示学习等领域的研究成果，从媒体转载预测、新闻转载识别、转载群体分析三个角度展开对媒体转载行为的分析研究，主要工作如下： 1. 基于注意力机制的媒体转载预测方法。不同媒体对相同新闻文本关注的内容存在差异，针对如何为不同媒体生成特定新闻语义表征的挑战性问题，本文提出基于注意力机制融合媒体转载关联以及媒体发布内容的转载预测方法。该方法首先基于网络表示学习方法分析转载网络拓扑结构生成媒体向量表示；在新闻语义表示学习过程中，基于注意力机制将媒体向量表示作为注意力来源以定位媒体关注内容，实现对相同的内容特征为不同媒体赋予差异化的语义权重，从而生成媒体特定的内容表示；最后联合媒体向量表示以及新闻内容表示预测媒体转载关系。实验表明，本文提出的媒体转载预测模型实现了媒体转载关联和媒体发布内容的有效融合，能够准确捕获媒体对新闻内容的关注差异，便于更好地理解媒体转载行为。 2. 基于多层次语义建模的新闻转载识别方法。新闻转载过程中存在句子、段落、篇章等不同层面的摘编，可能存在词语变体、句式转换、文章结构重排等多种转述表达形式。针对如何捕获新闻间不同层次的深度语义相似性信息的挑战性问题，本文提出的转载识别方法分别从词语-句子层次、句子-段落-篇章层次全面度量新闻标题、正文之间的语义相似性。对于标题信息，模型通过词语移动距离衡量词语层次的相似性，句子层次的相似性特征采用双向长短期记忆网络获得语义表示之后映射到匹配空间中进行学习。对于正文信息，模型采用层次化双向长短期记忆网络学习句子、段落、篇章三个层次的语义表达然后通过交互匹配提取相似性特征。最终，模型联合标题以及正文的所有层次相似性特征识别新闻转载关系。实验表明，相比传统方法，本文提出的新闻转载识别模型能够全面建模新闻间多层次的语义相似性，有助于识别更丰富的新闻转载模式。 3. 基于BERT和变分图自编码模型的转载群体分析方法。转载过程中关联紧密且发布内容相似的媒体形成不同的群体。针对如何构建有效的媒体语义特征从而更好地捕获其与媒体关联之间的潜在内部关联的挑战性问题，本文提出基于预训练语言模型BERT以及变分图自编码模型的转载群体分析方法。该方法首先基于BERT对媒体发布内容进行编码并进一步构建媒体语义特征；然后采用变分图自编码模型在迭代信息传递框架中显式利用媒体关联关系聚合媒体语义特征，从而学习集成结构以及语义信息的媒体向量表示；最后通过聚类媒体向量表示实现群体划分。实验表明，本文提出的转载群体分析方法能够有效表征媒体语义，挖掘其与媒体关联间的深层联系，从而学习出准确反映媒体特征的向量表示，提升群体划分的性能。
语种	中文
页码	100
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/39054]
专题	自动化研究所_复杂系统管理与控制国家重点实验室_互联网大数据与安全信息学研究中心
推荐引用方式 GB/T 7714	姚日恒. 基于深度神经网络的媒体转载行为分析研究[D]. 北京. 中国科学院大学. 2020.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们