一种面向化学深层网的移动可变数据窗提取技术 | |
袁小龙 ; 李晓霞 ; 郭力 | |
2011 | |
会议名称 | 第十一届全国计算(机)化学学术会议 |
会议日期 | 2011-08-05 |
会议地点 | 中国甘肃兰州 |
关键词 | 化学深层网 移动可变数据窗 数据提取 XML 模板提取 |
页码 | 2 |
中文摘要 | <正>网络上的免费化学数据库资源网站一般属于化学深层网范畴,其数据页面隐藏于以表单为特征的网站检索入口之后为动态生成或独立存在的网页。这些化学数据页面无法通过超链接分析被通用搜索引擎索引和检索,具有形式统一、数据规范的特点。为了获取这些有价值的深层网数据,目前通常采用基于HTML结构特征的正则表达式的自动/半自动化提取或基于XML的半结构化提取对检索得到的数据结果页面进行提取。其中正则表达式提取为全文模 |
会议录 | 第十一届全国计算(机)化学学术会议论文摘要集
![]() |
内容类型 | 会议论文 |
源URL | [http://ir.ipe.ac.cn/handle/122111/2582] ![]() |
专题 | 过程工程研究所_研究所(批量导入) |
推荐引用方式 GB/T 7714 | 袁小龙,李晓霞,郭力. 一种面向化学深层网的移动可变数据窗提取技术[C]. 见:第十一届全国计算(机)化学学术会议. 中国甘肃兰州. 2011-08-05. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论