MySQL :: MySQL 8.3 Reference Manual :: 15.1.20.9 Secondary Indexes and Generated Columns

Documentation Home

version 8.3

8.0 current
5.7

8.0 Japanese

MySQL 8.3 Reference Manual / ... / Secondary Indexes and Generated Columns

15.1.20.9 二级索引和生成列

InnoDB 支持虚拟生成列上的二级索引。其他索引类型不支持。虚拟列上的二级索引有时被称为 “虚拟索引”。

可以在一个或多个虚拟列或虚拟列和常规列或存储生成列的组合上创建二级索引。包括虚拟列的二级索引可以定义为 UNIQUE。

当在虚拟生成列上创建二级索引时，生成列值将在索引记录中materialized。如果索引是一个 covering index（一个包含查询检索的所有列的索引），生成列值将从索引结构中的materialized值中检索，而不是实时计算的。

使用虚拟列上的二级索引时，需要考虑写入成本，因为在 INSERT 和 UPDATE 操作中需要materialize虚拟列值。即使有额外的写入成本，虚拟列上的二级索引可能比生成的存储列更可取，因为存储列在聚集索引中materialized，导致表格变大，需要更多的磁盘空间和内存。如果没有在虚拟列上定义二级索引，那么在读取时需要计算虚拟列值，会产生额外的成本。

索引虚拟列的值将被MVCC日志记录，以避免在回滚或清除操作期间重新计算生成列值。日志记录的数据长度受限于索引键的限制， COMPACT 和 REDUNDANT 行格式为 767 字节，DYNAMIC 和 COMPRESSED 行格式为 3072 字节。

添加或删除虚拟列上的二级索引是一个就地操作。

使用生成列提供 JSON 列索引

如前所述，JSON 列不能被直接索引。要创建一个间接引用该列的索引，可以定义一个生成列来提取要索引的信息，然后在生成列上创建索引，如下面的示例所示：

mysql> CREATE TABLE jemp (
    ->     c JSON,
    ->     g INT GENERATED ALWAYS AS (c->"$.id"),
    ->     INDEX i (g)
    -> );
Query OK, 0 rows affected (0.28 sec)

mysql> INSERT INTO jemp (c) VALUES
     >   ('{"id": "1", "name": "Fred"}'), ('{"id": "2", "name": "Wilma"}'),
     >   ('{"id": "3", "name": "Barney"}'), ('{"id": "4", "name": "Betty"}');
Query OK, 4 rows affected (0.04 sec)
Records: 4  Duplicates: 0  Warnings: 0

mysql> SELECT c->>"$.name" AS name
     >     FROM jemp WHERE g > 2;
+--------+
| name   |
+--------+
| Barney |
| Betty  |
+--------+
2 rows in set (0.00 sec)

mysql> EXPLAIN SELECT c->>"$.name" AS name
     >    FROM jemp WHERE g > 2\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: jemp
   partitions: NULL
         type: range
possible_keys: i
          key: i
      key_len: 5
          ref: NULL
         rows: 2
     filtered: 100.00
        Extra: Using where
1 row in set, 1 warning (0.00 sec)

mysql> SHOW WARNINGS\G
*************************** 1. row ***************************
  Level: Note
   Code: 1003
Message: /* select#1 */ select json_unquote(json_extract(`test`.`jemp`.`c`,'$.name'))
AS `name` from `test`.`jemp` where (`test`.`jemp`.`g` > 2)
1 row in set (0.00 sec)

(我们将最后一条语句的输出包装在这个示例中，以适应查看区域。)

当您在 EXPLAIN 上使用 SELECT 或其他包含一个或多个使用 -> 或 ->> 运算符的表达式的 SQL 语句时，这些表达式将被翻译为使用 JSON_EXTRACT() 和（如果需要）JSON_UNQUOTE() 的等效表达式，如下面的 SHOW WARNINGS 输出所示：

mysql> EXPLAIN SELECT c->>"$.name"
     > FROM jemp WHERE g > 2 ORDER BY c->"$.name"\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: jemp
   partitions: NULL
         type: range
possible_keys: i
          key: i
      key_len: 5
          ref: NULL
         rows: 2
     filtered: 100.00
        Extra: Using where; Using filesort
1 row in set, 1 warning (0.00 sec)

mysql> SHOW WARNINGS\G
*************************** 1. row ***************************
  Level: Note
   Code: 1003
Message: /* select#1 */ select json_unquote(json_extract(`test`.`jemp`.`c`,'$.name')) AS
`c->>"$.name"` from `test`.`jemp` where (`test`.`jemp`.`g` > 2) order by
json_extract(`test`.`jemp`.`c`,'$.name')
1 row in set (0.00 sec)

请参阅 -> 和 ->> 运算符的描述，以及 JSON_EXTRACT() 和 JSON_UNQUOTE() 函数的描述，以获取更多信息和示例。

这种技术也可以用于提供间接引用其他类型列的索引，这些列不能直接索引，例如 GEOMETRY 列。

也可以使用 JSON 列上的 JSON_VALUE() 函数创建索引，以优化使用该表达式的查询。请参阅该函数的描述，以获取更多信息和示例。

JSON columns and indirect indexing in NDB Cluster

在 MySQL NDB Cluster 中，也可以使用 JSON 列的间接索引，subject to the following conditions：

NDB 将 JSON 列值内部处理为 BLOB。这意味着任何包含一个或多个 JSON 列的 NDB 表都必须具有主键，否则无法记录到二进制日志中。
NDB 存储引擎不支持虚拟列的索引。由于生成列的默认值为 VIRTUAL，因此您必须明确指定要应用间接索引的生成列为 STORED。

用于创建表 jempn 的 CREATE TABLE 语句是之前显示的 jemp 表的修改版本，以便与 NDB 兼容：

CREATE TABLE jempn (
  a BIGINT NOT NULL AUTO_INCREMENT PRIMARY KEY,
  c JSON DEFAULT NULL,
  g INT GENERATED ALWAYS AS (c->"$.id") STORED,
  INDEX i (g)
) ENGINE=NDB;

我们可以使用以下 INSERT 语句填充该表：

INSERT INTO jempn (c) VALUES
  ('{"id": "1", "name": "Fred"}'),
  ('{"id": "2", "name": "Wilma"}'),
  ('{"id": "3", "name": "Barney"}'),
  ('{"id": "4", "name": "Betty"}');

现在 NDB 可以使用索引 i，如下所示：

mysql> EXPLAIN SELECT c->>"$.name" AS name
    ->           FROM jempn WHERE g > 2\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: jempn
   partitions: p0,p1,p2,p3
         type: range
possible_keys: i
          key: i
      key_len: 5
          ref: NULL
         rows: 3
     filtered: 100.00
        Extra: Using pushed condition (`test`.`jempn`.`g` > 2)
1 row in set, 1 warning (0.01 sec)

mysql> SHOW WARNINGS\G
*************************** 1. row ***************************
  Level: Note
   Code: 1003
Message: /* select#1 */ select
json_unquote(json_extract(`test`.`jempn`.`c`,'$.name')) AS `name` from
`test`.`jempn` where (`test`.`jempn`.`g` > 2)   
1 row in set (0.00 sec)

您应该牢记，存储生成的列，以及该列上的任何索引，都使用 数据内存。

PREV HOME UP NEXT