• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 作文范文 > 正文

    基于孤立点的手写数字识别算法研究 手写识别算法

    时间:2019-03-30 03:32:26 来源:雅意学习网 本文已影响 雅意学习网手机站

      摘要:在信息化飞速发展的时代,字符识别是信息录入和转化的一个重要内容。其中,手写体数字的识别有着非常广泛的应用,如邮政编码、手机手写等。该文使用一种基于“孤立点”、交叉数和中间数的手写数字识别方法,利用孤立点对数字(0-9)进行首次分类,再利用交叉数和中间数对分类后的数字进行进一步分类和识别。实验结果表明,该算法有效提高了数字识别的效率。
      关键词:特征提取;孤立点;交叉数;中间数;效率
      中图分类号:TP18文献标识码:A文章编号:1009-3044(2012)16-3969-04
      Research of Handwritten Numeral Recognition Algorithm Based on the Outlier
      ZHU Xiao-yan1, ZHANG Xi-zhi2
      (1.Software College of Henan University, Zhengzhou 450064, China;2. Department of Information Management ,Shengda Economics Trade & Management College of Zhengzhou, Xinzheng 451191,China)
      Abstract: In the age of information development, character recognition is an important content of information input and conversion.Hand? written numeral recognition has a very wide range of applications, such as postal code, mobile phone handwriting recognition. This paper presents a handwritten digital recognition method based on the" outlier", crossing number and middle number , which uses isolated point to digital (0-9) for classification, then uses crossing number and middle number for further classification and recognition. The test results show that, the algorithm can improve the efficiency of digital recognition.
      Key words: Feature extraction ;outlier; crossing number; middle number; efficiency
      在信息化飞速发展的时代,字符识别是信息录入和转化的一个重要内容。字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字、英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据。
      手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸张或者与计算机相连的手写板上的阿拉伯数字。随着社会信息化的发展,手写数字的识别研究有着重大的实用价值,如在邮政编码、税务报表、统计报表财务报表、银行票据、海关等需要处理大量字符信息录入的场合。手写数字的识别也具有商业意义,现在市面上流行实用的各种写字笔,手机上面嵌入的手写功能等等。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。[1]
      数字字符识别是目前模式识别功能的一个重要组成部分。基于孤立点、交叉数和中间数研究,该文研究了一种新的手写数字识别算法。主要内容包括:对所写字符进行截取以及扫描所写字符并利用特征提取获得孤立点、交叉点和和中间点,从而进行数字识别。
       1数字识别概述
      手写体数字识别方法大体可分为两类:基于统计的识别方法和基于结构的识别方法。第一类方法包括模板匹配法、矩法、笔道的点密度测试、字符轨迹法及数字变换法等。第二类则是尽量抽取数字的骨架或轮廓特征,如孤立点、交叉点、内部的虚实,起点和终点位于中线的位置等,两类方法具有一定的互补性。该文中使用了一个基于结构特征的分类识别。
      数字识别的基本过程分为位图模式确定,位图截取,数字识别和输出结果四部分。其中,位图模式是指使用在手写过程中,任何一个图形的形成都是有有限个像素点组成的位图和像素阵列来表示的图像,基于这种模式我们可以获取图形的大小和一些特征。
      位图截取指通过对位图模式的扫描,根据上,下,左,右四个方向扫描,首先获取到的点就作为该方向的边界。识别指对刚才截取的图像重新进行扫描,根据算法获取到孤立点个数,交叉数的数目和中间数的值,依据它们进行识别。最后,识别完成后,在相应的区域输出所识别的结果,如果无法识别,也需要做相应处理。
      1的孤立点有两个,并且对书写的1的细度有要求,此时1也没识别。7的左下部分的三分之一为空,此时7也没识别出来。
      由于手写数字字符的任意性比较高,对一些数字字符还存在识别错误和不能识别。一个是因为鼠标书写的不易操作性造成了书写时可能做成圈,还有一些顿笔。一个是对特征提取的还不足够多,以至于在有些数字的识别上出现错误识别。
      由于本算法对特征提取的不足,如果能把手写区域那部分的区域进行扩大,例如扩大到16×16的像素点界面,就能很好的解决鼠标的不易操作性和顿笔。另外是改进算法,获取足够多的特征进行识别。例如基于BP神经网络的识别算法就比较好,不过它要预先存入相当多的样本,在对不熟悉的字符进行识别时,必须先进行样本训练,等到获得相当多的样本时,提取特征,进行识别。
      [1]张宏林,Visual C++数字图像模式识别技术及工程实践[M].北京:人民邮电出版社,2003:167-196.
      [2]郑灵芝,黄德才.基于最近邻相似度的孤立点检测及半监督聚类算法[J].计算机系统应用,2012(2).

    推荐访问:孤立 手写 算法 识别

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章