本期的每周一库带来的是img_hash,一个rust下的pHash算法实现。
关于pHash,一般翻译为感知哈希算法,算法通过DCT离散余弦来用固定大小矩阵(一般位8 X 8)把图像像素数据转换为频率数据,然后通过二值化计算得到图像的二进制数组,最后通过计算Hamming distance来得到两张图片的相似度数据。
下面是img_hash的相关链接
我们通过例子来使用img_hash库
开发环境
- OS: Windows 10
rustc --version
:rustc 1.45.2 (d3fb005a3 2020-07-31)
cargo --version
:cargo 1.45.1 (f242df6ed 2020-07-22)
在工程中的Cargo.toml
文件中添加引用
[dependencies]
img_hash = "3.1.0"
然后我们准备三张用于测试的图片,其中image 2是用image 1涂抹部分区域得到的
接下来我们根据img_hash提供的示例代码稍作修改写入,分别计算我们准备的三张图片的区别
- image 1和image 2的Hamming distance
- image 1和image 3的Hamming distance
- image 2和image 3的Hamming distance
示例代码
extern crate image;
extern crate img_hash;
use img_hash::{HasherConfig};
fn main() {
let image1 = image::open("C:\\Temp\\1.png").unwrap();
let image2 = image::open("C:\\Temp\\2.png").unwrap();
let image3 = image::open("C:\\Temp\\3.png").unwrap();
let hasher = HasherConfig::new().to_hasher();
let hash1 = hasher.hash_image(&image1);
let hash2 = hasher.hash_image(&image2);
let hash3 = hasher.hash_image(&image3);
println!("Image1 hash: {}", hash1.to_base64());
println!("Image2 hash: {}", hash2.to_base64());
println!("Image3 hash: {}", hash3.to_base64());
println!("Hamming Distance, image 1 to image 2: {}", hash1.dist(&hash2));
println!("Hamming Distance, image 2 to image 3: {}", hash2.dist(&hash3));
println!("Hamming Distance, image 1 to image 3: {}", hash1.dist(&hash3));
}
运行结果
从运行结果我们可以看到,image 1和image 2的相似度更高,所有harmming distance更小,从另一个角度来看,image 2要比image 1更具有对image 3的相似性。
以上就是本期的每周一库
1
共 1 条评论, 1 页
评论区
写评论我用这个库开发了一个简单的命令行工具:imghasher 批量计算多个图片文件的图像哈希,也可以同时用图像哈希给它们重命名 可以递归整个文件夹的所有图片
这样可以方便地组织许多名字混乱的图片文件,也可以防止重复性的图片
Github链接: imghasher