CORC  > 清华大学
文本信息抽取平台的设计与实现——基于机器学习
辛欣 ; 李涓子 ; Xin Xin ; Juanzi Li
2010-07-15 ; 2010-07-15
会议名称中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集 ; Chinese Computing Technologies and Related Linguistic Issues--Proceedings of the 7th International Conference on Chinese Computing ; 第七届中文信息处理国际会议 ; The 7th International Conference on Chinese Computing ; 中国湖北武汉 ; CNKI ; 中国中文信息学会、新加坡中文与东方语言信息处理学会、武汉大学语言与信息研究中心
关键词信息抽取 机器学习 支持向量机 条件随机场 Information Extraction Machine Learning Support Vector Machine Conditional Random Field TP181 TP391.1
其他题名Design and Implementation of a Textual Information Extraction Platform——Based on Machine Learning
中文摘要本文设计了一种可行的通用文本信息抽取平台的框架,使得用户可以在平台上轻易的针对不同数据集尝试不同机器学习算法进行信息抽取。按照该框架,我们开发了一个信息抽取平台原型:KEGSMART。它集成了“手工标注”,“抽取结果分析与比较”,“应用演示输出”三个可视化工具和“支持向量机”, “条件随机场”两种机器学习算法。两个抽取任务分别应用不同的算法在平台上实验,实验结果验证了该平台的实用性。; This paper has designed a practical framework of information extraction platform.It can integrate different machine learning models and can be used to different applications.A prototype system has been developed under this framework.Manual annotation,model building and analysis,and extraction tools serve as visual module; Support Vector Machine,Conditional Random Field are integrated as algorithms.Two applications using difference algorithms are experienced on the platform,and the results show that the platform has good utility.
会议录出版者电子工业出版社
语种中文 ; 中文
内容类型会议论文
源URL[http://hdl.handle.net/123456789/70626]  
专题清华大学
推荐引用方式
GB/T 7714
辛欣,李涓子,Xin Xin,等. 文本信息抽取平台的设计与实现——基于机器学习[C]. 见:中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集, Chinese Computing Technologies and Related Linguistic Issues--Proceedings of the 7th International Conference on Chinese Computing, 第七届中文信息处理国际会议, The 7th International Conference on Chinese Computing, 中国湖北武汉, CNKI, 中国中文信息学会、新加坡中文与东方语言信息处理学会、武汉大学语言与信息研究中心.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace