您所在的位置: 成果库 结合阈值和投影法的图、表、文混排版面分析系统及方法

结合阈值和投影法的图、表、文混排版面分析系统及方法

发布时间: 2022-05-17

基本信息

合作方式: 技术转让
成果类型: 发明专利
行业领域:
其他
成果介绍

本发明公开了一种结合阈值和投影法的图、表、文混排版面分析方法,包括如下步骤:S1、将按阈值Tg将校正后的灰度图像R’转变为二值(黑白)图像;S2、将二值图像中每个前景区域,分为文字区域和非文字区域;S3、将表分图解析成表格;S4、将每个表格分割成行/列:S5、检测整幅图像的页面布局是否正确;S6、对列/行排序决定下一步处理的先后次序,先列后行;S7、对表格的每个列/行,先列后行,只处理单纯的列/行,依次分割成字;S8、按字处理复合的列/行,依次分割成字。本发明能够解析版面布局,确定页面是正面、背面,上下、左右是否颠倒,也能够处理粘连在表上的字,还能够大幅提高文字的识别率。

成果亮点
团队介绍
成果资料