CORC  > 清华大学
面向中英平行专利的双语术语自动抽取
孙茂松 ; 李莉 ; 刘知远 ; SUN Maosong ; LI Li ; LIU Zhiyuan
2016-03-30 ; 2016-03-30
关键词短语对齐 条件随机场 组块分析 双语术语 sun sensor multiplexing image detector high accuracy large field of view TP391.1
其他题名Unsupervised bilingual terminology extraction algorithm for Chinese-English parallel patents
中文摘要双语术语自动抽取是自然语言处理领域的重要研究课题之一,对于跨语言检索、机器翻译,以及双语词典的构建等具有重要意义。该文提出了一种面向中英平行专利语料的无监督双语术语自动抽取算法。该算法利用基于短语的统计机器翻译模型中的短语对齐和基于条件随机场的组块分析,实现双语术语自动抽取,同时借助专利语料的领域主题信息进一步提高双语术语抽取的准确率。实验表明:该算法在5 867组电通信技术领域的中英平行专利文档上进行双语术语的自动抽取,准确率达到94.00%。; Automatic bilingual terminology extraction is one of the most important natural language processing(NLP)tasks,which is meaningful for cross-language information retrieval and machine translation. An unsupervised bilingual terminology extraction algorithm is developed for Chinese-English parallel patents,which utilizes phrase alignment of statistical machine translation and chunk analysis based on conditional random fields(CRF)to extract bilingual terminologies.This algorithm makes use of detailed topics information of patents to improve the precision of bilingual terminology extraction.Experiments demonstrate that this algorithm has a precision up to 94%.
语种中文 ; 中文
内容类型期刊论文
源URL[http://ir.lib.tsinghua.edu.cn/ir/item.do?handle=123456789/146959]  
专题清华大学
推荐引用方式
GB/T 7714
孙茂松,李莉,刘知远,等. 面向中英平行专利的双语术语自动抽取[J],2016, 2016.
APA 孙茂松,李莉,刘知远,SUN Maosong,LI Li,&LIU Zhiyuan.(2016).面向中英平行专利的双语术语自动抽取..
MLA 孙茂松,et al."面向中英平行专利的双语术语自动抽取".(2016).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace