蕴含地理事件微博客消息的自动识别方法
仇培元; 陆锋; 张恒才; 余丽
刊名地球信息科学学报
2016
卷号018期号:007页码:886
ISSN号1560-8999
英文摘要微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。
语种英语
内容类型期刊论文
源URL[http://ir.igsnrr.ac.cn/handle/311030/119528]  
专题中国科学院地理科学与资源研究所
作者单位中国科学院地理科学与资源研究所
推荐引用方式
GB/T 7714
仇培元,陆锋,张恒才,等. 蕴含地理事件微博客消息的自动识别方法[J]. 地球信息科学学报,2016,018(007):886.
APA 仇培元,陆锋,张恒才,&余丽.(2016).蕴含地理事件微博客消息的自动识别方法.地球信息科学学报,018(007),886.
MLA 仇培元,et al."蕴含地理事件微博客消息的自动识别方法".地球信息科学学报 018.007(2016):886.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace