CORC  > 北京大学  > 软件与微电子学院
基于快速构建模板的购物信息抽取方法; Shopping information extraction method based on rapid construction of template
李萍 ; 朱建波 ; 周立新 ; 廖彬
刊名计算机应用
2014
关键词模板 电子商务 信息抽取 购物信息 商品 template electronic commerce information extraction shopping information goods
DOI10.11772/j.issn.1001-9081.2014.03.0733
英文摘要针对由模板生成的购物信息网页,且根据其网页信息量大,网页结构复杂的特点,提出了一种不使用复杂的学习规则,而将购物信息从模板网页中抽取出来的方法.研究内容包括定义网页模板和网页的信息抽取模板,设计用于快速构建模板的模板语言,并提出一种基于模板语言抽取内容的模型.实验结果表明,在标准的450个网页的测试集下,所提方法的召回率相比抽取问题算法(EXALG)提高了12%;在250个网页的测试集下,召回率相比基于视觉信息和标签结构的包装器生成器(ViNTs)方法和增加自动信息抽取和视觉感知(ViPER)方法分别提升了7.4%,0.2%;准确率相比ViNTs方法和ViPER方法分别提升了5.2%,0.2%.基于快速构建模板的信息抽取方法的召回率和准确率都有很大提升,使得购物信息检索和购物比价系统中的网页分析的准确性和信息召回率得到很大的改进.; 国家自然科学基金资助项目; 中文核心期刊要目总览(PKU); 中国科技核心期刊(ISTIC); 中国科学引文数据库(CSCD); 0; 3; 733-737,753; 34
语种中文
内容类型期刊论文
源URL[http://ir.pku.edu.cn/handle/20.500.11897/212850]  
专题软件与微电子学院
推荐引用方式
GB/T 7714
李萍,朱建波,周立新,等. 基于快速构建模板的购物信息抽取方法, Shopping information extraction method based on rapid construction of template[J]. 计算机应用,2014.
APA 李萍,朱建波,周立新,&廖彬.(2014).基于快速构建模板的购物信息抽取方法.计算机应用.
MLA 李萍,et al."基于快速构建模板的购物信息抽取方法".计算机应用 (2014).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace