MySQL 有许多操作符和函数返回字符串。这一节回答了以下问题:这样的字符串的字符集和排序规则是什么?
对于简单的函数,它们接受字符串输入并返回字符串结果输出,输出的字符集和排序规则与主要输入值相同。例如, UPPER(
返回一个具有相同字符字符串和排序规则的字符串 X
)X
。同样适用于 INSTR()
, LCASE()
, LOWER()
, LTRIM()
, MID()
, REPEAT()
, REPLACE()
, REVERSE()
, RIGHT()
, RPAD()
, RTRIM()
, SOUNDEX()
, SUBSTRING()
, TRIM()
, UCASE()
, 和 UPPER()
。
然而,REPLACE()
函数不同于所有其他函数,它总是忽略字符串输入的排序规则,并执行区分大小写的比较。
如果字符串输入或函数结果是一个二进制字符串,那么该字符串具有 binary
字符集和排序规则。这可以通过使用 CHARSET()
和 COLLATION()
函数来检查,这两个函数都将返回 binary
对于二进制字符串参数:
mysql> SELECT CHARSET(BINARY 'a'), COLLATION(BINARY 'a');
+---------------------+-----------------------+
| CHARSET(BINARY 'a') | COLLATION(BINARY 'a') |
+---------------------+-----------------------+
| binary | binary |
+---------------------+-----------------------+
对于将多个字符串输入组合并返回单个字符串输出的操作,标准 SQL 的聚合规则适用于确定结果的排序规则:
-
如果出现明确的
COLLATE
,则使用Y
Y
。 -
如果出现明确的
COLLATE
和Y
COLLATE
,则引发错误。Z
-
否则,如果所有排序规则都是
Y
,则使用Y
。 -
否则,结果没有排序规则。
例如,使用 CASE ... WHEN a THEN b WHEN b THEN c COLLATE
,结果的排序规则是 X
ENDX
。同样适用于 UNION
, ||
, CONCAT()
, ELT()
, GREATEST()
, IF()
, 和 LEAST()
。
对于将数据转换为字符数据的操作,结果字符串的字符集和排序规则由 character_set_connection
和 collation_connection
系统变量定义,这些变量确定默认连接字符集和排序规则(见 第 12.4 节,“连接字符集和排序规则”)。这仅适用于 BIN_TO_UUID()
、CAST()
、CONV()
、FORMAT()
、HEX()
和 SPACE()
。
对虚拟生成列的表达式存在一个例外。在这些表达式中,对于 BIN_TO_UUID()
、CONV()
或 HEX()
结果,总是使用表字符集,而不管连接字符集如何。
如果您对字符串函数返回结果的字符集或排序规则有任何疑问,可以使用 CHARSET()
或 COLLATION()
函数来查找:
mysql> SELECT USER(), CHARSET(USER()), COLLATION(USER());
+----------------+-----------------+--------------------+
| USER() | CHARSET(USER()) | COLLATION(USER()) |
+----------------+-----------------+--------------------+
| test@localhost | utf8mb3 | utf8mb3_general_ci |
+----------------+-----------------+--------------------+
mysql> SELECT CHARSET(COMPRESS('abc')), COLLATION(COMPRESS('abc'));
+--------------------------+----------------------------+
| CHARSET(COMPRESS('abc')) | COLLATION(COMPRESS('abc')) |
+--------------------------+----------------------------+
| binary | binary |
+--------------------------+----------------------------+