Related Documentation Download this Manual
PDF (US Ltr) - 40.8Mb
PDF (A4) - 40.9Mb
Man Pages (TGZ) - 294.0Kb
Man Pages (Zip) - 409.0Kb
Info (Gzip) - 4.0Mb
Info (Zip) - 4.0Mb
Excerpts from this Manual

MySQL 8.3 Reference Manual  /  ...  /  LINEAR HASH Partitioning

26.2.4.1 线性哈希分区

MySQL 还支持线性哈希,它与常规哈希不同,线性哈希使用二次幂算法,而常规哈希使用哈希函数的模数。

在语法上,线性哈希分区和常规哈希分区的唯一区别是 PARTITION BY 子句中添加了 LINEAR 关键字,如下所示:

CREATE TABLE employees (
    id INT NOT NULL,
    fname VARCHAR(30),
    lname VARCHAR(30),
    hired DATE NOT NULL DEFAULT '1970-01-01',
    separated DATE NOT NULL DEFAULT '9999-12-31',
    job_code INT,
    store_id INT
)
PARTITION BY LINEAR HASH( YEAR(hired) )
PARTITIONS 4;

给定一个表达式 expr,当使用线性哈希时,记录存储在哪个分区中取决于以下算法:

  1. 找到大于 num 的下一个 2 的幂。我们称这个值为 V;它可以根据以下算法计算:

    V = POWER(2, CEILING(LOG(2, num)))

    (假设 num 是 13。那么 LOG(2,13) 是 3.7004397181411。CEILING(3.7004397181411) 是 4,V = POWER(2,4),即 16。)

  2. 设置 N = F(column_list) & (V - 1)。

  3. 只要 N >= num

    • 设置 V = V / 2

    • 设置 N = N & (V - 1)

假设表 t1 使用线性哈希分区,具有 6 个分区,使用以下语句创建:

CREATE TABLE t1 (col1 INT, col2 CHAR(5), col3 DATE)
    PARTITION BY LINEAR HASH( YEAR(col3) )
    PARTITIONS 6;

现在假设您想将两个记录插入 t1,其中 col3 列的值分别为 '2003-04-14''1998-10-19'。第一个记录的分区号是按照以下方式确定的:

V = POWER(2, CEILING( LOG(2,6) )) = 8
N = YEAR('2003-04-14') & (8 - 1)
   = 2003 & 7
   = 3

(3 >= 6 is FALSE: record stored in partition #3)

第二个记录的分区号是按照以下方式计算的:

V = 8
N = YEAR('1998-10-19') & (8 - 1)
  = 1998 & 7
  = 6

(6 >= 6 is TRUE: additional step required)

N = 6 & ((8 / 2) - 1)
  = 6 & 3
  = 2

(2 >= 6 is FALSE: record stored in partition #2)

使用线性哈希分区的优点是添加、删除、合并和拆分分区变得非常快,这在处理大量数据(TB 级别)时非常有益。但是,数据在分区之间的分布不如使用常规哈希分区那样均匀。