图像局部特征检测及描述
上QQ阅读APP看书,第一时间看更新

1.2 常用术语

为表述方便,本节将对本书涉及的基本术语进行介绍。

1.2.1 图像兴趣点

几何定义中一个点是空间中的一个位置,但没有空间范围。顾名思义,图像兴趣点(point of interest或interest point)也是图像中的最小空间单元,即像素。某些应用(如相机标定或三维重建)最终只关心特征提取所得到的位置(有时定位精度可达亚像素级),而完全忽略了空间范围,然而,位置点的确定常常会用到其周围像素的灰度或彩色信息。在另外一些任务(比如图像拼接、目标识别等)中,图像中像素一般只有 256 个灰度级别,最多只能区分 256 种情况。同时同一物体在不同环境下的成像存在偏差,在匹配任务中为提高像素点的可区分性和匹配结果的稳定性,通常先选取一个特定的范围,并从中提取特征,因此,所有局部特征都隐含一定的空间范围。这个包含丰富信息的特殊区域,严格地讲,应该被称为兴趣区域,但习惯上被称为兴趣点,也称为特征点[8-9]。本书讨论的特征点包括兴趣点和兴趣区域,这些内容可能指图像中的角点、边缘、直线或斑点。

1.2.2 特征检测

一幅图像的各个部分包含的信息量是不同的,图像处理需要找到其中信息量最大的部分,这些部分一般是灰度特殊变化的区域。在图像上提取满足某种显著性指标的特征点的过程称为特征检测(feature detection)。

特征检测在不同的图像处理任务中的具体内容和目标不同。比如,在目标识别任务中边缘处常由于视角变化而引起局部特征的巨大变化。因此,希望特征检测把这类区域排除,但是在测量任务中,边缘点提供最重要的信息,希望特征检测不能漏掉这类区域。这些任务中,特征检测的最终目的是一致的,都是去除干扰因素的影响,提高最终结果的准确性和稳定性。

1.2.3 特征提取

由于成像视角、光照、成像设备质量等不相同,同一物体在不同成像中的图像特征的差别可能非常大。比如同一个人在室外和在室内的照片亮度差别非常大,虽然人眼很容易就能判断是同一个人,但计算机直接从原图识别就相当困难。为此,可以采用一些方法提高识别的准确率,比如采用亮度比代替亮度值,从而使不同光照下物体的亮度值更接近,或者降低光照的影响。类似的一系列处理最终得到一组表征区别特征,又不受光照等无关因素影响的向量的过程,称为特征提取(feature extraction)。

提取图像特征一直被认为是计算机视觉领域最重要的步骤,特征提取也是模式识别中的一个重要的预处理步骤[10]。特征提取存在广义定义和狭义定义之分。从狭义上讲,特征提取是从一组原始测量数据开始构建信息充分保留且无冗余的向量值(特征)的过程[11-14],其目的是使后续任务便于执行或结果更优,或者获得更好的人类感知。特征提取一般包括将原始测量数据转变为特征空间数据的特征构建和通过特征选择实现的特征降维两个过程[15]。从广义上讲,特征提取为特征检测和特征描述两过程的总称[16],其中,特征描述是特征提取的核心任务。

特征提取在不同的场合中的具体含义不同。对全局特征而言,不需要确定特征的位置,因而,特征提取的主要内容为在数学上对图像中的信息进行编码形成描述符,即一组向量[17]。在此情况下,一般选用特征提取的狭义定义。对局部特征而言,选择一个能稳定表达的特征点或区域非常重要,此时,特征提取一般选用其广义定义。本书主要讨论局部特征,为方便描述,本书中除特别说明外特征提取都为其广义定义。图1.1表示了全局特征和局部特征描述的区别。

图1.1 全局特征和局部特征的描述

1.2.4 像素点的邻域

在图像处理过程中,经常会用到像素点周边的信息,根据选用的范围不同,计算复杂度也不同,常用4邻域和8邻域表示,如图1.2所示。用方块表示图像中的一个像素点,像素点E正上方、正下方、正左方和正右方的4个像素点称为像素点E的4邻域,如图1.2(a)所示。像素点E的8邻域与像素点E的空间位置关系如图1.2(b)所示。

图1.2 像素点E的邻域