图像相似性搜索的原理
?每张图片都可以生成其灰度图像直方图(histogram)。如果两张图片的直方图很接近,就可以认为它们很相似。 ?1、获得输入灰度图像的直方图分布; 2、将直方图划分为64个区,每个区为连续的4个灰度等级; 3、对每个区的4个值进行求和运算,得到1个数据,如此,会得到64个数据,即为该幅图像的一个向量(指纹); 4、根据步骤【1、2、3】,我们将输入的两幅图像转化为了2个向量,记为A、B; 5、计算两个向量的相似度,可以用皮尔逊相关系数或者余弦相似度计算,这里我们采用【余弦相似度】;下面就顺便介绍一下余弦相似度的概念及用法: ? ? 以二维空间为例,上图的a和b是两个向量,我们要计算它们的夹角θ。余弦定理告诉我们,可以用下面的公式求得: ? ? 假定a向量是[x1,y1],b向量是[x2,y2],那么可以将余弦定理改写成下面的形式: ? ? 数学家已经证明,余弦的这种计算方法对n维向量也成立。假定A和B是两个n维向量,A是 [A1,A2,...,An] ,B是 [B1,B2,Bn] ,则A与B的夹角θ的余弦等于: ? 使用这个公式,我们就可以得到,句子A与句子B的夹角的余弦。 余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。
(编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |