MySQL 8.3 Release Notes
示例 1:德语 Umlauts 的排序
假设表 T
的列 X
具有以下 latin1
列值:
Muffler
Müller
MX Systems
MySQL
假设还使用以下语句检索列值:
SELECT X FROM T ORDER BY X COLLATE collation_name;
下表显示了使用不同排序规则时的值顺序。
latin1_swedish_ci |
latin1_german1_ci |
latin1_german2_ci |
---|---|---|
Muffler | Muffler | Müller |
MX Systems | Müller | Muffler |
Müller | MX Systems | MX Systems |
MySQL | MySQL | MySQL |
在这个示例中,导致不同排序顺序的字符是 ü
(德语“U-umlaut”)。
-
第一列显示了使用瑞典/芬兰排序规则的结果,该规则规定 U-umlaut 排序与 Y 相同。
-
第二列显示了使用德国 DIN-1 规则的结果,该规则规定 U-umlaut 排序与 U 相同。
-
第三列显示了使用德国 DIN-2 规则的结果,该规则规定 U-umlaut 排序与 UE 相同。
示例 2:搜索德语 Umlauts
假设你有三个表,它们唯一的区别是字符集和排序规则:
mysql> SET NAMES utf8mb4;
mysql> CREATE TABLE german1 (
c CHAR(10)
) CHARACTER SET latin1 COLLATE latin1_german1_ci;
mysql> CREATE TABLE german2 (
c CHAR(10)
) CHARACTER SET latin1 COLLATE latin1_german2_ci;
mysql> CREATE TABLE germanutf8 (
c CHAR(10)
) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
每个表包含两个记录:
mysql> INSERT INTO german1 VALUES ('Bar'), ('Bär');
mysql> INSERT INTO german2 VALUES ('Bar'), ('Bär');
mysql> INSERT INTO germanutf8 VALUES ('Bar'), ('Bär');
两个排序规则都有 A = Ä
相等性,而一个没有这种相等性(latin1_german2_ci
)。因此,比较结果如下所示:
mysql> SELECT * FROM german1 WHERE c = 'Bär';
+------+
| c |
+------+
| Bar |
| Bär |
+------+
mysql> SELECT * FROM german2 WHERE c = 'Bär';
+------+
| c |
+------+
| Bär |
+------+
mysql> SELECT * FROM germanutf8 WHERE c = 'Bär';
+------+
| c |
+------+
| Bar |
| Bär |
+------+
这不是一个 bug,而是 latin1_german1_ci
和 utf8mb4_unicode_ci
排序规则的结果(排序按照德国 DIN 5007 标准进行)。