CORC  > 自动化研究所  > 中国科学院自动化研究所  > 学术期刊  > 自动化学报
基于预训练表示模型的英语词语简化方法
强继朋; 钱镇宇; 李云; 袁运浩; 朱毅
刊名自动化学报
2022
卷号48期号:8页码:2075-2087
关键词词语简化 候选词生成 候选词排序 预训练语言表示模型
ISSN号0254-4156
DOI10.16383/j.aas.c200723
英文摘要词语简化是将给定句子中的复杂词替换成意义相等的简单替代词,从而达到简化句子的目的.已有的词语简化方法只依靠复杂词本身而不考虑其上下文信息来生成候选替换词,这将不可避免地产生大量的虚假候选词.为此,提出了一种基于预语言训练表示模型的词语简化方法,利用预训练语言表示模进行候选替换词的生成和排序.基于预语言训练表示模型的词语简化方法在候选词生成过程中,不仅不需要任何语义词典和平行语料,而且能够充分考虑复杂词本身和上下文信息产生候选替代词.在候选替代词排序过程中,基于预语言训练表示模型的词语简化方法采用了5个高效的特征,除了常用的词频和词语之间相似度特征之外,还利用了预训练语言表示模的预测排名、基于基于预语言训练表示模型的上、下文产生概率和复述数据库PPDB三个新特征.通过3个基准数据集进行验证,基于预语言训练表示模型的词语简化方法取得了明显的进步,整体性能平均比最先进的方法准确率高出29.8%.
内容类型期刊论文
源URL[http://ir.ia.ac.cn/handle/173211/56310]  
专题自动化研究所_学术期刊_自动化学报
推荐引用方式
GB/T 7714
强继朋,钱镇宇,李云,等. 基于预训练表示模型的英语词语简化方法[J]. 自动化学报,2022,48(8):2075-2087.
APA 强继朋,钱镇宇,李云,袁运浩,&朱毅.(2022).基于预训练表示模型的英语词语简化方法.自动化学报,48(8),2075-2087.
MLA 强继朋,et al."基于预训练表示模型的英语词语简化方法".自动化学报 48.8(2022):2075-2087.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace