什么是bloom(布隆)过滤器

用多个hash算法对一个值进行运算,拿着得到的多个hash值去对应的hash槽上查看,以确认该值是否存在。

为何使用多个hash算法

由于hash算法所使用的散列公式得出的散列值存在产生碰撞的可能性,同时使用多个hash算法能够降低不同的值产生相同hash值的可能性,所以bloom(布隆)过滤器会存在误判的,这是它的一个特点。

用途

从海量数据中查找某个值是否存在,常见的垃圾邮箱检测算法。

实现

Redis的bitmap、Google的guava、bigtable、Apache的HBase、Cassandra等。