12.10.2 西欧字符集
西欧字符集涵盖了法语、西班牙语、加泰罗尼亚语、巴斯克语、葡萄牙语、意大利语、阿尔巴尼亚语、荷兰语、德语、丹麦语、瑞典语、挪威语、芬兰语、法罗语、冰岛语、爱尔兰语和英语等西欧语言。
-
ascii
(US ASCII) 排序规则:-
ascii_bin
-
ascii_general_ci
(默认)
-
-
cp850
(DOS 西欧) 排序规则:-
cp850_bin
-
cp850_general_ci
(默认)
-
-
dec8
(DEC 西欧) 排序规则:-
dec8_bin
-
dec8_swedish_ci
(默认)
字符集
dec
已弃用,预计在未来 MySQL 版本中将被移除。 -
-
hp8
(HP 西欧) 排序规则:-
hp8_bin
-
hp8_english_ci
(默认)
字符集
hp8
已弃用,预计在未来 MySQL 版本中将被移除。 -
-
latin1
(cp1252 西欧) 排序规则:-
latin1_bin
-
latin1_danish_ci
-
latin1_general_ci
-
latin1_general_cs
-
latin1_german1_ci
-
latin1_german2_ci
-
latin1_spanish_ci
-
latin1_swedish_ci
(默认)
MySQL 的
latin1
与 Windows 的cp1252
字符集相同。这意味着它与官方的ISO 8859-1
或 IANA (latin1
相同,except IANAlatin1
将代码点之间0x80
和0x9f
视为““undefined,””,而cp1252
和因此 MySQL 的latin1
分配字符给这些位置。例如,0x80
是欧元符号。对于cp1252
中的““undefined” 项,MySQL 将0x81
翻译为 Unicode0x0081
,0x8d
翻译为0x008d
,0x8f
翻译为0x008f
,0x90
翻译为0x0090
,0x9d
翻译为0x009d
。默认的
latin1_swedish_ci
排序规则可能是大多数 MySQL 客户端使用的。虽然它经常被说是基于瑞典/芬兰排序规则,但有瑞典人和芬兰人不同意这个说法。latin1_german1_ci 和 latin1_german2_ci 排序规则基于德国标准 DIN-1 和 DIN-2,DIN 是 德国标准化协会 的简称(ANSI 的等价物)。DIN-1 称为“词典排序”,DIN-2 称为“电话簿排序”。关于比较或搜索的示例,请参阅第12.8.6节,“排序规则效果”。
-
latin1_german1_ci
(词典)规则:Ä = A Ö = O Ü = U ß = s
-
latin1_german2_ci
(电话簿)规则:Ä = AE Ö = OE Ü = UE ß = ss
在 latin1_spanish_ci 排序中,
ñ
(n-tilde) 是n
和o
之间的单独字母。 -
-
macroman
(Mac 西欧) 排序:-
macroman_bin
-
macroman_general_ci
(默认)
macroroman
已弃用,预计在未来 MySQL 版本中将被删除。 -
-
swe7
(7位瑞典) 排序:-
swe7_bin
-
swe7_swedish_ci
(默认)
-