用于非规范格式手写中文地址的识别方法

申请公布号:
CN104598887A
申请号:
CN201510044955.1
申请日期:
2015.01.29
申请公布日期:
2015.05.06
申请人:
华东师范大学
发明人:
吕岳;韦箫华;吕淑静
分类号:
G06K9/00(2006.01)I;G06K9/68(2006.01)I
主分类号:
G06K9/00(2006.01)I
代理机构:
上海蓝迪专利事务所 31215
代理人:
徐筱梅;张翔
地址:
200241 上海市闵行区东川路500号
摘要:
本发明给出了一种用于非规范格式手写中文地址的识别方法,并建立了一个规范格式的地址表示方法。本方法提出用词级树的结构来存储中文地址库,其中每个结点存储一个地址词,从根结点到叶子结点的一条路径则存储一个规范格式书写的地址。整个地址识别包括:构建词级树;构建字符索引表;图像过分割;合并分割块;字符识别;生成候选地址词;规范格式地址识别。本发明可将非规范格式书写的地址映射到规范格式的对应地址,从而实现识别。
主权项:
一种用于非规范格式手写中文地址的识别方法,其特征在于该方法包括以下步骤:构建词级树,用以表示并存储规范书写格式的地址;构建字符索引表,用以表示单个字符和地址词之间的关联;分割‑识别处理,用于对图像进行字符的分割,合并及对分割块合并所成的候选模式块进行字符识别;生成候选地址词,用于得到置信度较高的候选地址词;规范格式地址识别,用于将待识别手写地址映射到所对应的规范格式书写的方式。
专利推荐
移动版 | 电脑版 | 返回顶部