< 返回版块

西沉 发表于 2020-08-28 01:15

本期的每周一库带来的是img_hash,一个rust下的pHash算法实现。

关于pHash,一般翻译为感知哈希算法,算法通过DCT离散余弦来用固定大小矩阵(一般位8 X 8)把图像像素数据转换为频率数据,然后通过二值化计算得到图像的二进制数组,最后通过计算Hamming distance来得到两张图片的相似度数据。

下面是img_hash的相关链接

我们通过例子来使用img_hash库

开发环境

  • OS: Windows 10
  • rustc --version: rustc 1.45.2 (d3fb005a3 2020-07-31)
  • cargo --version: cargo 1.45.1 (f242df6ed 2020-07-22)

在工程中的Cargo.toml文件中添加引用

[dependencies]
img_hash = "3.1.0"

然后我们准备三张用于测试的图片,其中image 2是用image 1涂抹部分区域得到的
rust-imghash.png

接下来我们根据img_hash提供的示例代码稍作修改写入,分别计算我们准备的三张图片的区别

  • image 1和image 2的Hamming distance
  • image 1和image 3的Hamming distance
  • image 2和image 3的Hamming distance

示例代码

extern crate image;
extern crate img_hash;
 
use img_hash::{HasherConfig};

fn main() {
    let image1 = image::open("C:\\Temp\\1.png").unwrap();
    let image2 = image::open("C:\\Temp\\2.png").unwrap();
    let image3 = image::open("C:\\Temp\\3.png").unwrap();
     
    let hasher = HasherConfig::new().to_hasher();

    let hash1 = hasher.hash_image(&image1);
    let hash2 = hasher.hash_image(&image2);
    let hash3 = hasher.hash_image(&image3);
     
    println!("Image1 hash: {}", hash1.to_base64());
    println!("Image2 hash: {}", hash2.to_base64());
    println!("Image3 hash: {}", hash3.to_base64());
     
    println!("Hamming Distance, image 1 to image 2: {}", hash1.dist(&hash2));
    println!("Hamming Distance, image 2 to image 3: {}", hash2.dist(&hash3));
    println!("Hamming Distance, image 1 to image 3: {}", hash1.dist(&hash3));
}

运行结果
rust-imghash-hdistance.png

从运行结果我们可以看到,image 1和image 2的相似度更高,所有harmming distance更小,从另一个角度来看,image 2要比image 1更具有对image 3的相似性。

以上就是本期的每周一库

评论区

写评论
zhangzhilinx 2020-08-28 13:20

我用这个库开发了一个简单的命令行工具:imghasher 批量计算多个图片文件的图像哈希,也可以同时用图像哈希给它们重命名 可以递归整个文件夹的所有图片

这样可以方便地组织许多名字混乱的图片文件,也可以防止重复性的图片

Github链接: imghasher

1 共 1 条评论, 1 页