一种基于语义标注特征的金融文本分类方法 | |
罗明1; 黄海量2 | |
刊名 | 计算机应用研究
![]() |
2018 | |
卷号 | 35期号:8页码:2281-2284,2288 |
关键词 | 文本分类 金融文本 语义标注 词汇语义模式 有限状态机 text classification financial text semantic annotation lexical-semantic pattern finite state machine |
ISSN号 | 1001-3695 |
英文摘要 | 针对基于词袋的机器学习文本分类方法所存在的高维度、高稀疏性、不能识别同义词、语义信息缺失等问题,和基于规则模式的文本分类所存在的虽然准确率较高但鲁棒性较差的问题,提出了一种采用词汇语义规则模式从金融新闻文本中提取事件语义标注信息,并将其作为分类特征用于机器学习文本分类中的新方法。实验证明采用该方法相比基于词袋的文本分类方法在采用相同的特征选择算法和分类算法的基础上,F_1值提高8.6 %,查准率提高7.7%,查全率提高8.8%。本方法融合了知识驱动和数据驱动在文本分类中的优点,同时避免了它们所存在的主要缺点,具有显著的实用性和研究参考价值。 |
URL标识 | 查看原文 |
WOS研究方向 | Computer Science |
语种 | 中文 |
CSCD记录号 | CSCD:6323480 |
内容类型 | 期刊论文 |
源URL | [http://10.2.47.112/handle/2XS4QKH4/722] ![]() |
专题 | 上海财经大学 |
作者单位 | 1.上海财经大学信息管理与工程学院, 上海 200433, 中国; 2.上海财经大学信息管理与工程学院;;上海财经大学, ;;上海市金融信息技术研究重点实验室, ;;, 上海;;上海 200433;;200433, 中国 |
推荐引用方式 GB/T 7714 | 罗明,黄海量. 一种基于语义标注特征的金融文本分类方法[J]. 计算机应用研究,2018,35(8):2281-2284,2288. |
APA | 罗明,&黄海量.(2018).一种基于语义标注特征的金融文本分类方法.计算机应用研究,35(8),2281-2284,2288. |
MLA | 罗明,et al."一种基于语义标注特征的金融文本分类方法".计算机应用研究 35.8(2018):2281-2284,2288. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论