MySQL :: MySQL 8.3 Reference Manual :: 10.2.1.19 LIMIT Query Optimization

Documentation Home

version 8.3

8.0 current
5.7

8.0 Japanese

MySQL 8.3 Reference Manual / ... / LIMIT Query Optimization

10.2.1.19 LIMIT 查询优化

如果您只需要从结果集中获取指定数量的行，请在查询中使用 LIMIT 子句，而不是获取整个结果集然后抛弃多余的数据。

MySQL 有时会优化具有 LIMIT row_count 子句且没有 HAVING 子句的查询：

如果您使用 LIMIT 选择只有少数行，MySQL 在某些情况下使用索引，而不是执行全表扫描。
如果您将 LIMIT row_count 与 ORDER BY 结合使用，MySQL 将停止排序，一旦找到第一个 row_count 行的排序结果，而不是对整个结果集进行排序。如果使用索引进行排序，这将非常快。如果需要文件排序，所有匹配查询的行都将被选择，然后对其进行排序，直到找到第一个 row_count 行。然后，MySQL 不会对结果集的其余部分进行排序。

这种行为的一个体现是，带有和不带有 LIMIT 的 ORDER BY 查询可能会以不同的顺序返回行，如本节后面所述。
如果您将 LIMIT row_count 与 DISTINCT 结合使用，MySQL 将停止，一旦找到 row_count 个唯一的行。
在某些情况下，GROUP BY 可以通过按索引顺序读取（或对索引进行排序），然后计算汇总，直到索引值发生变化。在这种情况下，LIMIT row_count 不会计算任何不必要的 GROUP BY 值。
一旦 MySQL 将所需的行数发送到客户端，它将中止查询，除非您使用 SQL_CALC_FOUND_ROWS。在那种情况下，行数可以使用 SELECT FOUND_ROWS() 检索。请参阅第 14.15 节，“信息函数”。
LIMIT 0 快速返回一个空集。这可以用于检查查询的有效性。它也可以用于在应用程序中获取结果列的类型，该应用程序使用 MySQL API 提供结果集元数据。在 mysql 客户端程序中，您可以使用 --column-type-info 选项来显示结果列类型。
如果服务器使用临时表来解析查询，它将使用 LIMIT row_count 子句来计算所需的空间。
如果索引不用于 ORDER BY 但存在 LIMIT 子句，优化器可能可以避免使用合并文件，并使用内存中的文件排序操作对行进行排序。

如果多行在 ORDER BY 列中具有相同的值，服务器可以以任何顺序返回这些行，并且可能根据执行计划的不同而有所不同。换言之，这些行的排序顺序是非确定性的，关于非排序列。

一个影响执行计划的因素是 LIMIT，因此带有和不带有 LIMIT 的 ORDER BY 查询可能会以不同的顺序返回行。考虑以下查询，它按 category 列排序，但对 id 和 rating 列是非确定性的：

mysql> SELECT * FROM ratings ORDER BY category;
+----+----------+--------+
| id | category | rating |
+----+----------+--------+
|  1 |        1 |    4.5 |
|  5 |        1 |    3.2 |
|  3 |        2 |    3.7 |
|  4 |        2 |    3.5 |
|  6 |        2 |    3.5 |
|  2 |        3 |    5.0 |
|  7 |        3 |    2.7 |
+----+----------+--------+

包括 LIMIT 可能会影响每个 category 值中的行顺序。例如，这是一个有效的查询结果：

mysql> SELECT * FROM ratings ORDER BY category LIMIT 5;
+----+----------+--------+
| id | category | rating |
+----+----------+--------+
|  1 |        1 |    4.5 |
|  5 |        1 |    3.2 |
|  4 |        2 |    3.5 |
|  3 |        2 |    3.7 |
|  6 |        2 |    3.5 |
+----+----------+--------+

在每种情况下，行都是按 ORDER BY 列排序的，这是 SQL 标准所要求的。

如果确保带有和不带有 LIMIT 的行顺序相同非常重要，可以在 ORDER BY 子句中包括其他列，以使顺序确定性。例如，如果 id 值是唯一的，可以通过按 id 顺序对行进行排序，以使得每个 category 值中的行按 id 顺序出现：

mysql> SELECT * FROM ratings ORDER BY category, id;
+----+----------+--------+
| id | category | rating |
+----+----------+--------+
|  1 |        1 |    4.5 |
|  5 |        1 |    3.2 |
|  3 |        2 |    3.7 |
|  4 |        2 |    3.5 |
|  6 |        2 |    3.5 |
|  2 |        3 |    5.0 |
|  7 |        3 |    2.7 |
+----+----------+--------+

mysql> SELECT * FROM ratings ORDER BY category, id LIMIT 5;
+----+----------+--------+
| id | category | rating |
+----+----------+--------+
|  1 |        1 |    4.5 |
|  5 |        1 |    3.2 |
|  3 |        2 |    3.7 |
|  4 |        2 |    3.5 |
|  6 |        2 |    3.5 |
+----+----------+--------+

对于具有 ORDER BY 或 GROUP BY 和 LIMIT 子句的查询，优化器将尝试选择有序索引，以加速查询执行。在某些情况下，使用其他优化可能更快，可以通过设置 optimizer_switch 系统变量的 prefer_ordering_index 标志为 off 来关闭该优化。

示例：首先，我们创建并填充表 t，如下所示：

# Create and populate a table t:

mysql> CREATE TABLE t (
    ->     id1 BIGINT NOT NULL,
    ->     id2 BIGINT NOT NULL,
    ->     c1 VARCHAR(50) NOT NULL,
    ->     c2 VARCHAR(50) NOT NULL,
    ->  PRIMARY KEY (id1),
    ->  INDEX i (id2, c1)
    -> );

# [Insert some rows into table t - not shown]

验证 prefer_ordering_index 标志是否启用：

mysql> SELECT @@optimizer_switch LIKE '%prefer_ordering_index=on%';
+------------------------------------------------------+
| @@optimizer_switch LIKE '%prefer_ordering_index=on%' |
+------------------------------------------------------+
|                                                    1 |
+------------------------------------------------------+

由于以下查询具有 LIMIT 子句，我们期望它使用有序索引，如果可能。在这种情况下，如我们从 EXPLAIN 输出中看到的那样，它使用表的主键。

mysql> EXPLAIN SELECT c2 FROM t
    ->     WHERE id2 > 3
    ->     ORDER BY id1 ASC LIMIT 2\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: t
   partitions: NULL
         type: index
possible_keys: i
          key: PRIMARY
      key_len: 8
          ref: NULL
         rows: 2
     filtered: 70.00
        Extra: Using where

现在，我们禁用 prefer_ordering_index 标志，然后重新运行相同的查询；这次它使用索引 i(包括在 WHERE 子句中使用的 id2 列)，并进行文件排序：

mysql> SET optimizer_switch = "prefer_ordering_index=off";

mysql> EXPLAIN SELECT c2 FROM t
    ->     WHERE id2 > 3
    ->     ORDER BY id1 ASC LIMIT 2\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: t
   partitions: NULL
         type: range
possible_keys: i
          key: i
      key_len: 8
          ref: NULL
         rows: 14
     filtered: 100.00
        Extra: Using index condition; Using filesort

另见第 10.9.2 节，“可切换优化”。

PREV HOME UP NEXT