题名 | 人的数据库理解的研究 |
作者 | 郭萌 |
学位类别 | 工学硕士 |
答辩日期 | 1998-05-01 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 王珏 |
关键词 | 数据库知识发现(Knowledge Discovery in Database KDD) 自然语言生成 数据可视化 图文混和 |
学位专业 | 模式识别与智能系统 |
中文摘要 | 本文首先论述了数据挖掘(DataMining)与数据库知识发现(Knowledge Discovery in Database,KDD)技术的基本概念与任务以及所面临的问题,并强调了 “人的数据库理解(Database Understanding by Human Being)”任务的重要性与实 用性。并围绕着“人的数据库理解”这一任务展开了如下研究工作: 基于Rough Set(RS)理论的数据浓缩的研究:本研究将Pawlak提出的 Rough Set的约简方法应用于“数据浓缩”。为此,首先描述了一个基于差别矩 阵的有效约简策略,然后使用这个策略对来自UCI机器学习数据库的24个离 散数据库进行数据浓缩。 关于自然语言生成的研究:数据库经过RS约简后,会得到一个包含特征 属性和决策属性的规则表,我们希望得到更加清晰易懂的,自然语言描述的规则 表。本研究重点在于如何在机内表达句子的语义信息,以及如何把这种深层表达 转换为表层结构,从而生成句子。我们采用了“结构驱动”的自然语言生成方法, 实现了一个自然语言产生器,并将其用于几个实例中。 关于数据可视化的研究:用图形化表示来输出符号化信息,具有直观,生 动的特点,在KDD,智能数据库等领域有着举足轻重的作用。在本项研究中, 我们采用了计算几何学中的平行坐标系方法并加以适当的改进来表示多维数 据。 图文互补的可视化模型:我们看出,图形化表述和自然语言描述的优缺点 具有互补性。因此,我们认为,图文互补的表述可以在不丢失任何信息的情况下, 使人机接口更加易懂,易操作。本项研究的工作致力于对“图+文”的可视化 模型的实现,以及总结何时采用语言、何时采用图形的原则。另外,我们也试图 从图文互补的角度研究语言对图形的简化,以及图形对语言的简化作用。 本文最后对以后工作的进行了总结和展望. |
语种 | 中文 |
其他标识符 | 471 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/7223] |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 郭萌. 人的数据库理解的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 1998. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论