随着图像逐渐成为数据资源的一个重要组成部分,如何根据图像内容进行消冗就成为现代存储领域中的一个重要问题。本书首先针对经缩放变换、水印变换、灰度变换和存储格式变换得到的重复图像,提出利用感知哈希等多重过滤手段以提高检索精度,接着将研究工作进一步扩展到经旋转和裁剪变换得到的重复图像中,针对量化误差导致图像表示区分度低的问题,提出利用半监督学习引入语义信息从而将局部描述子量化为二进制编码以提高图像表示的可区分性。在此基础上,为了充分利用局部描述子之间的几何关系,提出对匹配描述子在二维空间内的投影进行二维云模型过滤以提高检索精度,然后根据质心图像选取原则提出一种基于模糊逻辑推理的质心图像选择方法并进行消冗,最后设计一套基于Hadoop集群的大规模重复图像消冗框架。本书既注重理论,又注重实践,初步构建了图像消冗的基本架构,本书可供高校计算机专业的学生阅读,同时也可供从事图像处理的相关研究者借鉴和参考。