CORC  > 北京大学  > 信息科学技术学院
从实际应用看GoogleTM语言模型的缺陷
张化瑞
2008
关键词文字处理 文档分析 语言模型 数理语言学
英文摘要在Google应用中使用的语言模型与其公开的Web 1T 5-gram库有很大不同,一个根本的差异体现在是否忽略标点符号。本文以谷歌拼音输入法作为切入点,通过典型性实例揭示了Google语言模型的两个具有普遍性的缺陷:内嵌标点也算连续字串,外部链接视同文档内容。文章给出了弥补这些缺陷的建议。; 0
语种中文
内容类型其他
源URL[http://ir.pku.edu.cn/handle/20.500.11897/280628]  
专题信息科学技术学院
推荐引用方式
GB/T 7714
张化瑞. 从实际应用看GoogleTM语言模型的缺陷. 2008-01-01.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace