广告图片中的文字检测方法设计与实现文献综述

 2022-11-28 06:11

广告图片中的文字检测方法设计与实现

文献综述

前言

近些年来随之互联网的高速发展,电子邮件也以成本低廉、方便快捷、高效互联的特点成为了一种广受欢迎的联系方式,但是垃圾邮件也“应运而生”,垃圾邮件不仅占用大量网络带宽、侵占用户信箱空间、耗费收件人的时间、精力和金钱,而且还会成为黑客的工具危害社会。

现在,发部分的垃圾邮件发送者会将文本转化为图像的形式进行“反过滤”,传统的以基于识别文本的方式对此是无能为力的。为了能够过滤这类图像式垃圾邮件,本项目将会采用基于边缘检测、特征提取等方式对于目标图像中文字进行标记显示。

课题研究的发展状况

目前该课题主要的研究方向在基于图片中文字的特征提取,在提取图片中文字特征的时候有基于数字图像点特征及边缘特征提取方法[1],基于边缘的方法[3],基于Gabor滤波的边缘检测方法[9],以及基于笔划识别的方法[5][10][11]。

在基于数字图像点特征及边缘特征提取方法[1]中,作者首先通过文献[2]定义了点特征是是指图像的灰度信号在二维方向上有明显变化的点如角点、圆点、交叉点等。在图像特征以及边缘特征提取中使用“亚像素”法不仅可以是提取的图像边缘更加连续、光滑还有效的解决了模糊图像边缘的问题。作者首先通过使用“像素级”的Roberts算子、Sobel算子、Prewitt算子以及LOG算子和Canny算子对边缘进行特征提取,而后进行抗噪实验对比这几个算子的性能,然后作者又介绍几种了“亚像素”法包括“基于矩阵保持的亚像素边缘定位算法”、“基于插值的亚像素边缘定位算法”以及“基于拟合的亚像素边缘定位算法”,而后作者将结合像素级与亚像素级提出了基于Canny算子的三次样条插值亚像素边缘检测算法并得到了比较理想的实验结果,其具体步骤首先采用Canny算子检测图像边缘:用高斯滤波器平滑图像,计算滤波后图像梯度的幅值和方向,对梯度幅值应用非极大值抑制,其过程为找出图像梯度中的局部极大值点,把其他非局部极大值点置零以得到细化的边缘,用双阈值算法检测和连接边缘,使用两个阈值Tl和T2(T1gt;T2),Tl用来找到每条线段,T2用来在这些线段的两个方向上延伸寻找边缘的断裂处,并连接这些边缘。然后使用三次样条插值具体做法是考虑一个浮点坐标周围的十六个邻点,然后使用以下公式计算像素值。

该文献中[1]中作者使用这种放法取得了不错的效果,但“鱼与熊掌不可兼得”,在特征点提取算子方面,衡量算子性能的各个指标往往是矛盾的,效率高、定位精确的算子往往速度较慢,不能适合于实时的应用需求;相反,计算速度快的算子通常算法简单,从而造成了精度不高的缺点,同样,在边缘特征检测中,边缘检测算子在抑制噪声和边缘精确定位上是无法同时满足的,Canny算子虽然是基于最优化思想所提出的算子,尽量在抑制噪声能力与边缘精确定位上同时达到最好的效果,但是理论与实际还是有许多不一致的地方。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版