基于对比度归一化的历史文档图像二值化算法
DOI:
作者:
作者单位:

西藏大学

作者简介:

通讯作者:

中图分类号:

TP391.43

基金项目:

国家自然科学基金项目(61661047),西藏自治区高校青年教师创新支持计划项目(QCZ2016-02)


Study of Historical Document Image Binarization on Contrast Normalization
Author:
Affiliation:

School of Engineering, Tibet University, Lhasa Tibet

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    多数历史文档图像存在背景污渍、涂抹和字迹模糊等对比度较低的情况,从而给历史文档二值化增加了较大难度。前期研究发现,历史文档中文本内容通常与文档背景的亮度水平不同,利用文档背景估计值可以有效削弱退化区域并突出字符信息,根据这两个观点,本文提出了一种基于对比度归一化的历史文档图像二值化算法。所提出的方法包含三个步骤,首先采用图像修复算法和Niblack算法结果来粗略估计背景,然后使用文档背景对历史文档图像存在的不同退化类型进行归一化处理,并对归一化处理后的文档图像进行增强、二值化,将文档中的文本分割出来。采用DIBCO数据库和H-DIBCO数据库对所提出的算法进行测试,取得了较好的实验结果。

    Abstract:

    Historical document often suffer from degradations, such as faint characters, smears and large background stains, that renders their binarization a challenging task. Motivated by the ideas that the text within document usually has a different intensity level compared with the surrounding background and the document background estimation is a way to effectively attenuate degraded regions, a new approach for the binarization of historical document is proposed in this paper. The proposed method contains three steps. First, we follow an inpainting procedure which using the Niblack binarization output to estimates the rough background. Then, image contrast normalization procedure is used to balance different types of historical document degradation by using the rough document background estimation. Finally, the document text is enhanced and segmented by an existing binarization technology from the normalized historical document images. The proposed approach has been tested on the DIBCO and H-DIBCO datasets of history document images and outperforms state-of-the-art techniques.

    参考文献
    相似文献
    引证文献
引用本文

冯炎. 基于对比度归一化的历史文档图像二值化算法[J]. 科学技术与工程, 2019, 19(1): .
冯炎. Study of Historical Document Image Binarization on Contrast Normalization[J]. Science Technology and Engineering,2019,19(1).

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-08-31
  • 最后修改日期:2018-10-30
  • 录用日期:2018-11-05
  • 在线发布日期: 2019-01-15
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注