MySQL 8.4 Release Notes
26.2.4.1 线性哈希分区
MySQL 还支持线性哈希,线性哈希与普通哈希不同,它使用的是线性对数算法,而不是普通哈希所用的模运算。
语法上,与普通哈希分区相比,线性哈希分区的唯一区别是在 PARTITION BY
子句中添加了 LINEAR
关键字,如下所示:
CREATE TABLE employees (
id INT NOT NULL,
fname VARCHAR(30),
lname VARCHAR(30),
hired DATE NOT NULL DEFAULT '1970-01-01',
separated DATE NOT NULL DEFAULT '9999-12-31',
job_code INT,
store_id INT
)
PARTITION BY LINEAR HASH( YEAR(hired) )
PARTITIONS 4;
给定一个表达式 expr
,当使用线性哈希时,记录被存储在第 N
个分区中,其中 N
是根据以下算法计算得出的:
-
找到大于
num
的最接近的 2 的幂次方,我们称之为V
,它可以通过以下公式计算得出:V = POWER(2, CEILING(LOG(2, num)))
(假设
num
是 13。那么LOG(2,13)
等于 3.7004397181411。CEILING(3.7004397181411)
等于 4,V
=POWER(2,4)
,即 16。) -
设置
N
=F
(column_list
) & (V
- 1)。 -
当
N
大于等于num
时:-
设置
V
=V
/ 2 -
设置
N
=N
& (V
- 1)
-
假设表 t1
,使用线性哈希分区,并且有 6 个分区,是通过以下语句创建的:
CREATE TABLE t1 (col1 INT, col2 CHAR(5), col3 DATE)
PARTITION BY LINEAR HASH( YEAR(col3) )
PARTITIONS 6;
现在假设你想要向 t1
插入两个记录,其中 col3
列的值分别为 '2003-04-14'
和 '1998-10-19'
。第一个记录所在分区的编号是通过以下方式计算得出的:
V = POWER(2, CEILING( LOG(2,6) )) = 8
N = YEAR('2003-04-14') & (8 - 1)
= 2003 & 7
= 3
(3 >= 6 is FALSE: record stored in partition #3)
第二个记录所在分区的编号是通过以下方式计算得出的:
V = 8
N = YEAR('1998-10-19') & (8 - 1)
= 1998 & 7
= 6
(6 >= 6 is TRUE: additional step required)
N = 6 & ((8 / 2) - 1)
= 6 & 3
= 2
(2 >= 6 is FALSE: record stored in partition #2)
线性哈希分区的优势在于添加、删除、合并和拆分分区的速度更快,这对于处理大量数据(如数十亿行)时非常有益。然而,相比之下,数据在分区之间的分布不够均匀,这与普通哈希分区所能达到的分布情况相比有一定的劣势。