ApacheDoris的Bitmap索引和BloomFilter索引使用及注意事项(apache doris)

admin3年前云主机30

内容介绍
  • 1. Bitmap索引的使用
    • 1.1 Bitmap索引介绍
    • 1.2 Bitmap索引使用的注意事项
    • 1.3 Bitmap索引的使用
  • 2. BloomFilter索引
    • 2.1 BloomFilter索引介绍
    • 2.2 BloomFilter原理
    • 2.3 BloomFilter索引的使用
    • 2.4 Doris BloomFilter使用场景
    • 2.5 Doris BloomFilter使用注意事项

1. Bitmap索引的使用

1.1 Bitmap索引介绍


bitmap index是一种位图索引,是一种快速数据结构,能够加快查询速度

1.2 Bitmap索引使用的注意事项


使用限制

  • 目前索引仅支持bitmap类型的索引
  • bitmap索引仅在单列上创建
  • bitmap索引能够应用在Duplicate、Uniq数据模型的所有列和Aggregate模型的key列上
  • bitmap索引仅在Segment V2储存格式下生效。当创建index时,表的存储格式将默认转换为V2格式

bitmap索引支持的数据类型:

  • TINYINT
  • SMALLINT
  • INT
  • UNSIGNEDINT
  • BIGINT
  • CHAR
  • VARCHAR
  • DATE
  • DATETIME
  • LARGEINT
  • DECIMAL
  • BOOL

1.3 Bitmap索引的使用

创建索引

mysql> create index if not exists click_bitmap_index on test_db.click (user_id) using bitmap comment 'bitmap index test';Query OK, 0 rows affected (0.05 sec)mysql>

查看索引

mysql> show index from test_db.click;+-------------------------------+------------+--------------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+-------------------+| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment |+-------------------------------+------------+--------------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+-------------------+| default_cluster:test_db.click | | click_bitmap_index | | user_id | | | | | | BITMAP | bitmap index test |+-------------------------------+------------+--------------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+-------------------+1 row in set (0.04 sec)mysql>

删除索引

mysql> drop index if exists click_bitmap_index on test_db.click;Query OK, 0 rows affected (0.03 sec)mysql>

2. BloomFilter索引

2.1 BloomFilter索引介绍

是一种多哈希函数映射的快速查找算法,本质上是一种位图结构。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合,因为BloomFilter会告诉调用者一个元素存在或不存在一个集合。但存在不一定准确

2.2 BloomFilter原理

实际上是由一个超长的二进制位数组和一系列的哈希函数组成。二进制位数组初始全部为0,当给定一个元素时,这个元素会被一系列哈希函数计算映射出一系列的值,所有的值在位数组的偏移量处置为1。而对于一个待查询的元素,也会用相同的哈希函数映射到位数组上,只要有一个哈希函数映射没有命中之前的元素的偏移量,则不存在于集合中

下图所示出一个m=18, k=3(m是该Bit数组的大小,k是Hash函数的个数)的Bloom Filter示例。集合中的x、y、z三个元素通过3个不同的哈希函数散列到位数组中。当查询元素w时,通过Hash函数计算之后因为有一个比特为0,因此w不在该集合中

正文内容:

BloomFilter索引也是以Block为粒度创建的。每个Block中,指定列的值作为一个集合生成一个BloomFilter索引条目,用于在查询是快速过滤不满足条件的数据

2.3 BloomFilter索引的使用

创建表使用BloomFilter索引

mysql> create table order_tb( -> user_id bigint, -> order_date date, -> city varchar(32), -> url varchar(512) -> ) distributed by hash(user_id, city) buckets 8 -> properties( -> 'bloom_filter_columns'='user_id,order_date' -> );Query OK, 0 rows affected (0.07 sec)mysql>

查看BloomFilter索引

mysql> show create table order_tb;

删除BloomFilter索引

mysql> alter table test_db.order_tb set ('bloom_filter_columns' = '');Query OK, 0 rows affected (0.05 sec)mysql>

修改BloomFilter索引

mysql> alter table test_db.order_tb set ('bloom_filter_columns' = 'user_id,city');Query OK, 0 rows affected (0.05 sec)mysql>

2.4 Doris BloomFilter使用场景

  • 首先BloomFilter适用于非前缀过滤
  • 查询会根据该列高频过滤,而且查询条件大多是in和=过滤
  • 不同于Bitmap, BloomFilter适用于高基数列。比如UserID。因为如果创建在低基数的列上,比如”性别“列,则每个Block几乎都会包含所有取值,导致BloomFilter索引失去意义

2.5 Doris BloomFilter使用注意事项

  • 不支持对Tinyint、Float、Double 类型的列建Bloom Filter索引
  • Bloom Filter索引只对in和=过滤查询有加速效果
  • 如果要查看某个查询是否命中了Bloom Filter索引,可以通过查询的Profile信息查看

到此这篇关于Apache Doris的Bitmap索引和BloomFilter索引使用的文章就介绍到这了,更多相关Apache Doris索引内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

《ApacheDoris的Bitmap索引和BloomFilter索引使用及注意事项(apache doris)》来自互联网同行内容,若有侵权,请联系我们删除!

免责声明:本文内容来自用户上传并发布,站点仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。请核实广告和内容真实性,谨慎使用。

相关文章

济南超算中心:探索数字化时代的未来道路

一、科技创新超算中心是国家重点建设的高性能计算基础设施之一,具有重要的战略地位。其科技创新至关重要,在不断推进我国信息化、数字化的发展进程中发挥着重要的支撑作用。首先,超算中心秉承创新创造的理念,打造...

企业遭到DDoS攻击会带来哪些影响?福建BGP高防服务器租用怎么使用?

企业遭到DDoS攻击会带来哪些影响?1、导致收入损失。企业在线业务可能是主要的收入来源,如果遭受DDoS攻击可能造成企业大部分收入损失。2、失去客户信任。网络和应用服务的可用性对于维持客户信任至关重要...

企业为什么选择租用高防服务器?福建电信100G高防服务器购买多少钱?

企业为什么选择租用高防服务器?“高防”,顾名思义,就犹如网络上加了类似像盾牌一样很高的防御,主要是指IDC领域的IDC机房或者线路有防御DDOS能力。高防服务器主要是比普通服务器多了防御服务,一般都是...

个人音乐类网站的发展模式(个人音乐类网站备案)

现在各种类型的网站都很多,音乐类网站也是一样,铺天盖地的新音乐网站层出不穷。在这里谈谈对音乐网站发展模式的考虑。 现有的音乐个人网站大体有两种模式:模式一:自己拥有独立的服务器,服务器上有上百G的mp...

新加坡GPU服务器有哪些用途?租用新加坡GPU服务器价格是多少?

新加坡GPU服务器能够应用于视频编解码、深度学习、海量计算处理以及游戏、图形渲染等场景,GPU出色的图形处理能力和高性能计算能力能够提高计算性能,有效解放计算压力,提升产品的计算处理效率与竞争力;此外...

centos下网卡总是启动失败怎么办

问题:无法启动网卡,报错截图如下:正文内容: 原因及解决方法:和网卡自带的NetworkManager套件有关,将其关闭即可。(inhv.cn)命令如下:1、临时关闭# systemctl st...