您所在的位置: 成果库 一种基于文本辅助的文本图像超分辨率重建方法

一种基于文本辅助的文本图像超分辨率重建方法

发布时间: 2025-11-05

基本信息

合作方式: 技术转让
成果类型: 新技术
行业领域:
电子信息技术,通信技术
成果介绍
鸶了时年焜惢呀识别是计算机视觉领域中一项基础而重要的任务,但面对低分辨率的文本图像时,识别准确率并籠元中理想。图像超分辨率技术是将低分辨率的图像通过一定的算法重建为高分辨率的图像。因此,可以将图像超分辨率作为文本识别的一项预处理工作,从而提高识别准确率。目前现有的图像超分辨率算法主要针对自然图像,旨在恢复图像的纹理细节,忽略了文本图像中特有的文本信息。 本团队提出了一种基于文本辅助的文本图像超分辨率重建方法,该方法设计了门控文本检测模块,利用两个卷积层和双向门控循环单元(GRU)进行序列特征提取,通过门控机制进行特征融合。另一方面,该方法在网络中增加了卷积块注意力机制模块(CBAM),通过将带有通道和空间注意力权重的特征输入到啮了时现控文本检测模块,进一步增强文本序列特征的提取。此外,该方法提出了一种新的损失函数,称为文本辅助损失,兼顾图像分辨率和文本的可读性两个目标,有效提升文本图像超分辨率模型的性能。
成果亮点
图像超分辨率技术即通过一定的算法将低分辨率的图像重建为高分辨率的图像,其仅通过计算机的处理重建出高分辨率的图像,可以减少高精度的图像获取设备带来的额外成本。同时,超分辨率技术可以尽可能地弥补由于图像信息采集不佳或传输压缩等情况下带来的图像降质。 本团队提出了一种基于文本辅助的图像超分辨率网络,如图1所示。首先,在文本图像超分辨率模型引入注意力机制对特征图赋予不同的权重,相比于其他普通的文本图像超分辨率模型,使超分辨率和后续的文本检测能更好地聚焦文字部分,从而提高模型的重建质量。其次,团队设计了如图2所示的门控文本检测模块,将文本序列特征与图像纹理特征进行了融合,相较于其他普通的超分辨率模型,其充分挖掘并利用了低分辨率图像中的文本信息,有助于提高文本图像的超分辨率重建质量。最后,提出了一种文本辅助损匍个月市,相较于原来的损失函数,文本辅助损失兼顾了文本图像的文本内容和分辨率,有助于生成可读性更强的賞高分辨率文本图像。
团队介绍
联系人: 庄老师 电话:15295039286 单位名称:常州市武进区科技成果转移中心
成果资料