产品讲技术 | 带你看懂什么是计算机视觉（一）

发布时间：2020-02-22 11:10:14 所属栏目：点评来源：做站长

导读：做为一名5岁的AI产品汪，刚好利用春节（疫情）假期在家整理了一些CV的文章，发现网上的资料质量参差不齐，内容缺斤少两，小白很难甄别/读懂，想对CV有一个系统的认识很难，就自己做了一个系统总结（小白可以当教材看）。本人并非CV领域专业人士（产品经理

一个完整的几何变换需要两部分运算：除了空间变换所需的运算外，还需要使用灰度插值算法。因为按照几何变换关系进行计算，输出图像的像素可能被映射到输入图像的非整数坐标上。而像素做为最小显示单位（矢量图形不是由像素构成的，矢量可以是一个点或一条线），我们要为输出图像找到最合适的整数像素点。

1.2.6 什么是灰度插值算法？

灰度插值算法，通常采用的方法有最近邻插值、双线性插值和双三次插值。在讲插值算法之前，我们先来看下图像的缩放问题。

传统的绘图工具中，有一种叫做“放大尺”的绘图工具，画家常用它来放大图画。在计算机上，我们将不再需求用放大尺去放大或缩小图像了，把这个工作交给程序来完成就可以了。

我们所说的图像都是指点阵图，也就是用一个像素矩阵来描述图像的方法，对于另一种图像：用函数来描述的图像的矢量图，不再本文讨论之列。

图像放大时，像素也相应地增加，但这些增加的像素从何而来？

这时插值就派上用场了：插值就是在不生成像素的情况下增加图像像素大小的一种方法，在周围像素色彩的基础上用数学公式计算丢失像素的色彩。

所以在放大图像时，图像看上去会比较平滑、干净，但必须注意的是插值并不能增加图像信息。

目的：因为图像空间变换不改变图像的像素值，只是对图像的像素值重新进行映射，在表示映射关系时，输出图像的像素可能被映射到输入图像的非整数坐标上，灰度插值算法就是为输出图像找到最合适的整数像素坐标。

在知道什么是插值后，让我们来一起看一下常用的插值算法的原理。

（1）最近邻插值法 Nearest Neighbour Interpolate

是最简单的一种插值算法，也称作零阶插值，就是令变换后像素的灰度值等于距它最近的输入像素的灰度值。也就是说照搬旁边的像素这样做结果，会产生明显可见的锯齿，在待求像素的四邻像素中，将距离待求像素最近的邻灰度值赋给待求像素。

设i+u, j+v(i, j为正整数， u, v为大于零小于1的小数，下同)为待求象素坐标，则待求象素灰度的值 f(i+u, j+v)

如下图所示：

产品讲技术 | 带你看懂什么是计算机视觉（一）

如果(i+u, j+v)落在A区，即u<0.5, v<0.5，则将左上角象素的灰度值赋给待求象素。同理，落在B区则赋予右上角的象素灰度值，落在C区则赋予左下角象素的灰度值，落在D区则赋予右下角象素的灰度值。最邻近元法计算量较小，但可能会造成插值生成的图像灰度上的不连续，在灰度变化的地方可能出现明显的锯齿状。

最近邻插值法实现的效果如下所示：

产品讲技术 | 带你看懂什么是计算机视觉（一）