蕴含地理事件微博客消息的自动识别方法 | |
仇培元; 陆锋; 张恒才; 余丽 | |
刊名 | 地球信息科学学报 |
2016 | |
卷号 | 018期号:007页码:886 |
ISSN号 | 1560-8999 |
英文摘要 | 微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。 |
语种 | 英语 |
内容类型 | 期刊论文 |
源URL | [http://ir.igsnrr.ac.cn/handle/311030/119528] |
专题 | 中国科学院地理科学与资源研究所 |
作者单位 | 中国科学院地理科学与资源研究所 |
推荐引用方式 GB/T 7714 | 仇培元,陆锋,张恒才,等. 蕴含地理事件微博客消息的自动识别方法[J]. 地球信息科学学报,2016,018(007):886. |
APA | 仇培元,陆锋,张恒才,&余丽.(2016).蕴含地理事件微博客消息的自动识别方法.地球信息科学学报,018(007),886. |
MLA | 仇培元,et al."蕴含地理事件微博客消息的自动识别方法".地球信息科学学报 018.007(2016):886. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论