CORC  > 清华大学
从HTML表格自动构建局部本体方法的研究
范莉娅 ; 肖田元 ; FAN Li-ya ; XIAO Tian-yuan
2010-06-09 ; 2010-06-09
关键词局部本体 定位表格 概念表格 属性单元格 值单元格 local ontology position-table concept-table attribute cell value cell TP311.10
其他题名Automatically extracting local ontologies via HTML tables
中文摘要通过对Web信息源中超文本标记语言表格特点的分析,提出了从超文本标记语言表格自动构建局部本体的方法。该方法包含四个步骤:采用过滤规则,区分定位表格和概念表格;以五元组序列形式化超文本标记语言表格;使用统计方法确定属性单元格;依据属性单元格间和表格间的位置关系,确定属性间关系。实验结果证明,该方法具有较高的准确性。; Through analyzing characteristics of HTML tables in Web information sources,a method of automatically extracting local ontology via HTML tables was presented. This method consisted of four basic steps:(1) adopting two filtering rules to distinguish between position-tables and concept-tables,(2) formalizing HTML tables,(3) using statistics to decide which cells were attribute cells,(4) employing the position relationships between attribute cells and between HTML tables to ascertain the relationships among attributes.Finally,the accuracy of this method was validated by experiments.; 国家863/CIMS主题资助项目(2004AA414020)~~
语种中文 ; 中文
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/57833]  
专题清华大学
推荐引用方式
GB/T 7714
范莉娅,肖田元,FAN Li-ya,等. 从HTML表格自动构建局部本体方法的研究[J],2010, 2010.
APA 范莉娅,肖田元,FAN Li-ya,&XIAO Tian-yuan.(2010).从HTML表格自动构建局部本体方法的研究..
MLA 范莉娅,et al."从HTML表格自动构建局部本体方法的研究".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace