CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名人的数据库理解的研究
作者郭萌
学位类别工学硕士
答辩日期1998-05-01
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师王珏
关键词数据库知识发现(Knowledge Discovery in Database KDD) 自然语言生成 数据可视化 图文混和
学位专业模式识别与智能系统
中文摘要本文首先论述了数据挖掘(DataMining)与数据库知识发现(Knowledge Discovery in Database,KDD)技术的基本概念与任务以及所面临的问题,并强调了 “人的数据库理解(Database Understanding by Human Being)”任务的重要性与实 用性。并围绕着“人的数据库理解”这一任务展开了如下研究工作: 基于Rough Set(RS)理论的数据浓缩的研究:本研究将Pawlak提出的 Rough Set的约简方法应用于“数据浓缩”。为此,首先描述了一个基于差别矩 阵的有效约简策略,然后使用这个策略对来自UCI机器学习数据库的24个离 散数据库进行数据浓缩。 关于自然语言生成的研究:数据库经过RS约简后,会得到一个包含特征 属性和决策属性的规则表,我们希望得到更加清晰易懂的,自然语言描述的规则 表。本研究重点在于如何在机内表达句子的语义信息,以及如何把这种深层表达 转换为表层结构,从而生成句子。我们采用了“结构驱动”的自然语言生成方法, 实现了一个自然语言产生器,并将其用于几个实例中。 关于数据可视化的研究:用图形化表示来输出符号化信息,具有直观,生 动的特点,在KDD,智能数据库等领域有着举足轻重的作用。在本项研究中, 我们采用了计算几何学中的平行坐标系方法并加以适当的改进来表示多维数 据。 图文互补的可视化模型:我们看出,图形化表述和自然语言描述的优缺点 具有互补性。因此,我们认为,图文互补的表述可以在不丢失任何信息的情况下, 使人机接口更加易懂,易操作。本项研究的工作致力于对“图+文”的可视化 模型的实现,以及总结何时采用语言、何时采用图形的原则。另外,我们也试图 从图文互补的角度研究语言对图形的简化,以及图形对语言的简化作用。 本文最后对以后工作的进行了总结和展望.
语种中文
其他标识符471
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/7223]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
郭萌. 人的数据库理解的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 1998.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace