基于快速构建模板的购物信息抽取方法; Shopping information extraction method based on rapid construction of template | |
李萍 ; 朱建波 ; 周立新 ; 廖彬 | |
刊名 | 计算机应用 |
2014 | |
关键词 | 模板 电子商务 信息抽取 购物信息 商品 template electronic commerce information extraction shopping information goods |
DOI | 10.11772/j.issn.1001-9081.2014.03.0733 |
英文摘要 | 针对由模板生成的购物信息网页,且根据其网页信息量大,网页结构复杂的特点,提出了一种不使用复杂的学习规则,而将购物信息从模板网页中抽取出来的方法.研究内容包括定义网页模板和网页的信息抽取模板,设计用于快速构建模板的模板语言,并提出一种基于模板语言抽取内容的模型.实验结果表明,在标准的450个网页的测试集下,所提方法的召回率相比抽取问题算法(EXALG)提高了12%;在250个网页的测试集下,召回率相比基于视觉信息和标签结构的包装器生成器(ViNTs)方法和增加自动信息抽取和视觉感知(ViPER)方法分别提升了7.4%,0.2%;准确率相比ViNTs方法和ViPER方法分别提升了5.2%,0.2%.基于快速构建模板的信息抽取方法的召回率和准确率都有很大提升,使得购物信息检索和购物比价系统中的网页分析的准确性和信息召回率得到很大的改进.; 国家自然科学基金资助项目; 中文核心期刊要目总览(PKU); 中国科技核心期刊(ISTIC); 中国科学引文数据库(CSCD); 0; 3; 733-737,753; 34 |
语种 | 中文 |
内容类型 | 期刊论文 |
源URL | [http://ir.pku.edu.cn/handle/20.500.11897/212850] |
专题 | 软件与微电子学院 |
推荐引用方式 GB/T 7714 | 李萍,朱建波,周立新,等. 基于快速构建模板的购物信息抽取方法, Shopping information extraction method based on rapid construction of template[J]. 计算机应用,2014. |
APA | 李萍,朱建波,周立新,&廖彬.(2014).基于快速构建模板的购物信息抽取方法.计算机应用. |
MLA | 李萍,et al."基于快速构建模板的购物信息抽取方法".计算机应用 (2014). |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论