CORC  > 北京大学  > 信息科学技术学院
《人民日报》1998年语料库中若干基本语言数据的统计与分析
胡景贺
2002
关键词词频 词类共现 散列 分布 边界 语料库 自然语言处理
英文摘要本文汇报了对"北京大学计算机语言所1998年《人民日报》语料库"半年语料的统计分析工作.其中统计了语料库中的词频、词在词类上的分布、词类的二元和三元共现、词与二元及三元词类的共现、各种共现在句子首尾端的边界分布.本文还对上述统计结果进行了分析,着重讨论了高频词语词类的分布以及句子的边界情况.这些结论对于该语料库的全面分析提供了重要的基础数据.; 0
语种中文
内容类型其他
源URL[http://ir.pku.edu.cn/handle/20.500.11897/152384]  
专题信息科学技术学院
推荐引用方式
GB/T 7714
胡景贺. 《人民日报》1998年语料库中若干基本语言数据的统计与分析. 2002-01-01.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace