CORC  > 清华大学
汉语述语形容词机器词典机器学习词聚类研究
王锦 ; 陈群秀 ; WANG Jin ; CHEN Qun-xiu
2010-06-09 ; 2010-06-09
关键词人工智能 机器翻译 机器学习 词聚类 搭配对 Kendallτ系数法 字面相似度 路径权值 artificial intelligence machine translation machine learning clustering compositional pairs Kendall's τ coefficient literal similarity route weight TP181
其他题名Clustering of Chinese Adjectives Based on the Machine Tractable Dictionary of Contemporary Chinese Predicate Adjectives
中文摘要本文提出了一个基于现代汉语述语形容词机器词典以及平衡语料库的形容词多信息聚类算法。聚类的过程根据形容词的语料提取了三重信息(所修饰的名词,同义近义词以及反义词),从而使形容词与形容词之间构成网络关系。本文重点描述了如何根据三重信息分别建模计算形容词的相似性并通过计算字面相似度以及路径权值这些辅助信息修正每两个形容词之间的相似度,从而在某种程度上缓解了数据稀疏的问题,实验结果显示该算法是有效的。; In this paper we present a method to group adjectives according to their corpora distribution,based on the Machine Tractable Dictionary of Contemporary Chinese Predicate Adjectives.We describe how our system extracts three groups of information for each adjective,which includes: modified nouns,synonyms,and antonyms,and exploits this knowledge to compute a measure of similarity between two adjectives with help of literal similarity and route weight of each adjective to another adjective,which in some extent solve the problem caused by sparse data.We also show how a clustering algorithm can use these similarities to produce the groups of adjectives,and we present results produced by our system for a sample set of adjectives.; 国家863计划资助项目(2001AA114210-01)
语种中文 ; 中文
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/55612]  
专题清华大学
推荐引用方式
GB/T 7714
王锦,陈群秀,WANG Jin,等. 汉语述语形容词机器词典机器学习词聚类研究[J],2010, 2010.
APA 王锦,陈群秀,WANG Jin,&CHEN Qun-xiu.(2010).汉语述语形容词机器词典机器学习词聚类研究..
MLA 王锦,et al."汉语述语形容词机器词典机器学习词聚类研究".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace