CORC  > 北京大学  > 信息科学技术学院
基于最大熵原则的汉语语义角色分类
丁伟伟 ; 常宝宝
2008
关键词汉字处理 语义分类 最大熵原则 数理语言学
英文摘要语义角色标注是近些年来兴起的自然语言处理的一个新的研究领域。本文在参考已有工作的基础上,基于最大熵原则,对汉语语义角色标注中的一个方面——语义角色分类进行了深入的研究。在提出了一些新的特征之后,充分利用了语义角色之间的相关性,使汉语语义角色分类由原来的单点分类的问题转化为序列标注的问题,从而提高标记的准确率。此外,通过对不同特征的单独研究,发现不同特征取得最优值时的窗口大小差别很大。发现这一现象后,设计了一种基于贪心策略的选择算法,对不同的特征选择不同的窗口大小,使得标记结果进一步提高。在综合采用了以上的策略之后,汉语语义角色分类系统可以达到95.00%的准确率,比前人有较为显著的提升。; 0
语种中文
内容类型其他
源URL[http://ir.pku.edu.cn/handle/20.500.11897/223169]  
专题信息科学技术学院
推荐引用方式
GB/T 7714
丁伟伟,常宝宝. 基于最大熵原则的汉语语义角色分类. 2008-01-01.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace