InnoDB
支持虚拟生成列上的二级索引。其他索引类型不支持。虚拟列上的二级索引有时被称为 “虚拟索引”。
可以在一个或多个虚拟列或虚拟列和常规列或存储生成列的组合上创建二级索引。包括虚拟列的二级索引可以定义为 UNIQUE
。
当在虚拟生成列上创建二级索引时,生成列值将在索引记录中materialized。如果索引是一个 covering index(一个包含查询检索的所有列的索引),生成列值将从索引结构中的materialized值中检索,而不是实时计算的。
使用虚拟列上的二级索引时,需要考虑写入成本,因为在 INSERT
和 UPDATE
操作中需要materialize虚拟列值。即使有额外的写入成本,虚拟列上的二级索引可能比生成的 存储 列更可取,因为存储列在聚集索引中materialized,导致表格变大,需要更多的磁盘空间和内存。如果没有在虚拟列上定义二级索引,那么在读取时需要计算虚拟列值,会产生额外的成本。
索引虚拟列的值将被MVCC日志记录,以避免在回滚或清除操作期间重新计算生成列值。日志记录的数据长度受限于索引键的限制, COMPACT 和 REDUNDANT 行格式为 767 字节,DYNAMIC 和 COMPRESSED 行格式为 3072 字节。
添加或删除虚拟列上的二级索引是一个就地操作。
如前所述,JSON
列不能被直接索引。要创建一个间接引用该列的索引,可以定义一个生成列来提取要索引的信息,然后在生成列上创建索引,如下面的示例所示:
mysql> CREATE TABLE jemp (
-> c JSON,
-> g INT GENERATED ALWAYS AS (c->"$.id"),
-> INDEX i (g)
-> );
Query OK, 0 rows affected (0.28 sec)
mysql> INSERT INTO jemp (c) VALUES
> ('{"id": "1", "name": "Fred"}'), ('{"id": "2", "name": "Wilma"}'),
> ('{"id": "3", "name": "Barney"}'), ('{"id": "4", "name": "Betty"}');
Query OK, 4 rows affected (0.04 sec)
Records: 4 Duplicates: 0 Warnings: 0
mysql> SELECT c->>"$.name" AS name
> FROM jemp WHERE g > 2;
+--------+
| name |
+--------+
| Barney |
| Betty |
+--------+
2 rows in set (0.00 sec)
mysql> EXPLAIN SELECT c->>"$.name" AS name
> FROM jemp WHERE g > 2\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: jemp
partitions: NULL
type: range
possible_keys: i
key: i
key_len: 5
ref: NULL
rows: 2
filtered: 100.00
Extra: Using where
1 row in set, 1 warning (0.00 sec)
mysql> SHOW WARNINGS\G
*************************** 1. row ***************************
Level: Note
Code: 1003
Message: /* select#1 */ select json_unquote(json_extract(`test`.`jemp`.`c`,'$.name'))
AS `name` from `test`.`jemp` where (`test`.`jemp`.`g` > 2)
1 row in set (0.00 sec)
(我们将最后一条语句的输出包装在这个示例中,以适应查看区域。)
当您在 EXPLAIN
上使用 SELECT
或其他包含一个或多个使用 ->
或 ->>
运算符的表达式的 SQL 语句时,这些表达式将被翻译为使用 JSON_EXTRACT()
和(如果需要)JSON_UNQUOTE()
的等效表达式,如下面的 SHOW WARNINGS
输出所示:
mysql> EXPLAIN SELECT c->>"$.name"
> FROM jemp WHERE g > 2 ORDER BY c->"$.name"\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: jemp
partitions: NULL
type: range
possible_keys: i
key: i
key_len: 5
ref: NULL
rows: 2
filtered: 100.00
Extra: Using where; Using filesort
1 row in set, 1 warning (0.00 sec)
mysql> SHOW WARNINGS\G
*************************** 1. row ***************************
Level: Note
Code: 1003
Message: /* select#1 */ select json_unquote(json_extract(`test`.`jemp`.`c`,'$.name')) AS
`c->>"$.name"` from `test`.`jemp` where (`test`.`jemp`.`g` > 2) order by
json_extract(`test`.`jemp`.`c`,'$.name')
1 row in set (0.00 sec)
请参阅 ->
和 ->>
运算符的描述,以及 JSON_EXTRACT()
和 JSON_UNQUOTE()
函数的描述,以获取更多信息和示例。
这种技术也可以用于提供间接引用其他类型列的索引,这些列不能直接索引,例如 GEOMETRY
列。
也可以使用 JSON
列上的 JSON_VALUE()
函数创建索引,以优化使用该表达式的查询。请参阅该函数的描述,以获取更多信息和示例。
JSON columns and indirect indexing in NDB Cluster
在 MySQL NDB Cluster 中,也可以使用 JSON 列的间接索引,subject to the following conditions:
用于创建表 jempn
的 CREATE TABLE
语句是之前显示的 jemp
表的修改版本,以便与 NDB
兼容:
CREATE TABLE jempn (
a BIGINT NOT NULL AUTO_INCREMENT PRIMARY KEY,
c JSON DEFAULT NULL,
g INT GENERATED ALWAYS AS (c->"$.id") STORED,
INDEX i (g)
) ENGINE=NDB;
我们可以使用以下 INSERT
语句填充该表:
INSERT INTO jempn (c) VALUES
('{"id": "1", "name": "Fred"}'),
('{"id": "2", "name": "Wilma"}'),
('{"id": "3", "name": "Barney"}'),
('{"id": "4", "name": "Betty"}');
现在 NDB
可以使用索引 i
,如下所示:
mysql> EXPLAIN SELECT c->>"$.name" AS name
-> FROM jempn WHERE g > 2\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: jempn
partitions: p0,p1,p2,p3
type: range
possible_keys: i
key: i
key_len: 5
ref: NULL
rows: 3
filtered: 100.00
Extra: Using pushed condition (`test`.`jempn`.`g` > 2)
1 row in set, 1 warning (0.01 sec)
mysql> SHOW WARNINGS\G
*************************** 1. row ***************************
Level: Note
Code: 1003
Message: /* select#1 */ select
json_unquote(json_extract(`test`.`jempn`.`c`,'$.name')) AS `name` from
`test`.`jempn` where (`test`.`jempn`.`g` > 2)
1 row in set (0.00 sec)
您应该牢记,存储生成的列,以及该列上的任何索引,都使用 数据内存
。