题名 | 基于象素屏蔽的表格提取研究 |
作者 | 宁屹 |
学位类别 | 工学硕士 |
答辩日期 | 1999-06-01 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 吴显礼 |
学位专业 | 模式识别与智能系统 |
中文摘要 | 本论文的研究主要集中在表格处理的表格提取方面。 针对表格提取的具体任务与要求,文中系统地分析了基于象素屏 蔽的表格提取的处理过程和具体方法.。并且,在基本方法的基础上, 根据实际的情况,提出了改进的算法和一些独特的构想。 在表格提取的校倾阶段,文中提出了对于通用算法的改进---多重 过滤连通算法,利用该算法,能较干净地找到图象中的长直线。 在表格提取的坐标对应阶段,文中将坐标对应问题转化为一个最 优化问题,并且给出了满意解的算法。 在表格提取的字符修补阶段,文中提出了屏蔽前后图象对比找断 点的方法,并且对于数字,给出了修补算法。 |
英文摘要 | This thesis mainly focuses on Form Dropout, which is a branch of Form Processing. According to the purpose and realistic request of Form Dropout, this paper systematically analyzes the main procedures in Form Dropout system, based on the pixel masking method. Furthermore, the author improves some algorithms, and presents some new ideas. The main points of this paper are as following: First, in stage of skew correction, a Multi-filter Connected Component Algorithms is proposed, which aims at finding long straight lines in form image. Second, in stage of coordinate correspondence, this paper transforms the problem into an optimization problem, and give out the algorithms to find a satisfactory solution. Third, in stage of broken stroke reconstruction, this paper proposes a method, based on comparison of an image before and after masking, to find the position of the broken strokes. And give out the algorithms to reconstruct broken numerals. |
语种 | 中文 |
其他标识符 | 525 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/7273] |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 宁屹. 基于象素屏蔽的表格提取研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 1999. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论