科研实体名称规范的研究与实践
张建勇1,2; 钱力1,2; 于倩倩1; 董智鹏1; 黄永文3; 刘建华4; 郭舒5; 王峰6
刊名数据分析与知识发现
2019
卷号3期号:01页码:27-37
关键词名称规范 期刊规范 机构规范 基金规范 作者规范
英文摘要

【目的】建立机构规范、作者规范、期刊规范、基金规范, 为发现系统、科研实体分析评价等建立数据基 础。 【方法】以多源异构数据为基础, 对数据进行汇聚和融合, 形成具有唯一标识符的统一的结构化数据。依据 名称规范元数据模型, 对科研实体及实体间的关系进行抽取。针对不同的科研实体可获取的文献特征, 制定不同 的消歧规则集合, 结合传统字符串匹配方法和深度学习方法进行文本相似度计算。【结果】形成包含 260 多万条 数据的机构规范库、2 300 多万条数据的作者规范库、3万多条数据的期刊规范库和 200 多万条数据的基金规范 库。以 NSTL机构规范为例, 与 InCites 机构规范进行对比, 结果显示所遴选的美、英、中 3个国家的 6所高校, 对 标吻合度平均值达到 86.8%。【局限】所提出的消歧规则和算法在处理文献特征表达形式多样性方面有待进一步 细化和提升;需对具体数据源数据情况进行分析,以选择合适的算法模型。【结论】本研究提出了多源异构数据 汇聚融合方法, 设计了科研实体消歧规则和算法, 能够有效实现名称规范数据库建设的规范性和全面性。

语种中文
内容类型期刊论文
源URL[http://ir.las.ac.cn/handle/12502/10536]  
专题文献情报中心_中国科学院文献情报中心_信息系统部
作者单位1.中国科学院文献情报中心
2.中国科学院大学图书情报与档案管理系
3.中国农业科学院农业信息研究所
4.上海科技大学图书馆
5.国家互联网应急中心
6.中国科学院自动化研究所
推荐引用方式
GB/T 7714
张建勇,钱力,于倩倩,等. 科研实体名称规范的研究与实践[J]. 数据分析与知识发现,2019,3(01):27-37.
APA 张建勇.,钱力.,于倩倩.,董智鹏.,黄永文.,...&王峰.(2019).科研实体名称规范的研究与实践.数据分析与知识发现,3(01),27-37.
MLA 张建勇,et al."科研实体名称规范的研究与实践".数据分析与知识发现 3.01(2019):27-37.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace