12.10.2 西欧字符集
西欧字符集涵盖了法语、西班牙语、加泰罗尼亚语、巴斯克语、葡萄牙语、意大利语、阿尔巴尼亚语、荷兰语、德语、丹麦语、瑞典语、挪威语、芬兰语、法罗语、冰岛语、爱尔兰语和英语等西欧语言。
-
ascii(US ASCII) 排序规则:-
ascii_bin -
ascii_general_ci(默认)
-
-
cp850(DOS 西欧) 排序规则:-
cp850_bin -
cp850_general_ci(默认)
-
-
dec8(DEC 西欧) 排序规则:-
dec8_bin -
dec8_swedish_ci(默认)
字符集
dec已弃用,预计在未来 MySQL 版本中将被移除。 -
-
hp8(HP 西欧) 排序规则:-
hp8_bin -
hp8_english_ci(默认)
字符集
hp8已弃用,预计在未来 MySQL 版本中将被移除。 -
-
latin1(cp1252 西欧) 排序规则:-
latin1_bin -
latin1_danish_ci -
latin1_general_ci -
latin1_general_cs -
latin1_german1_ci -
latin1_german2_ci -
latin1_spanish_ci -
latin1_swedish_ci(默认)
MySQL 的
latin1与 Windows 的cp1252字符集相同。这意味着它与官方的ISO 8859-1或 IANA (latin1相同,except IANAlatin1将代码点之间0x80和0x9f视为““undefined,””,而cp1252和因此 MySQL 的latin1分配字符给这些位置。例如,0x80是欧元符号。对于cp1252中的““undefined” 项,MySQL 将0x81翻译为 Unicode0x0081,0x8d翻译为0x008d,0x8f翻译为0x008f,0x90翻译为0x0090,0x9d翻译为0x009d。默认的
latin1_swedish_ci排序规则可能是大多数 MySQL 客户端使用的。虽然它经常被说是基于瑞典/芬兰排序规则,但有瑞典人和芬兰人不同意这个说法。latin1_german1_ci 和 latin1_german2_ci 排序规则基于德国标准 DIN-1 和 DIN-2,DIN 是 德国标准化协会 的简称(ANSI 的等价物)。DIN-1 称为“词典排序”,DIN-2 称为“电话簿排序”。关于比较或搜索的示例,请参阅第12.8.6节,“排序规则效果”。
-
latin1_german1_ci(词典)规则:Ä = A Ö = O Ü = U ß = s -
latin1_german2_ci(电话簿)规则:Ä = AE Ö = OE Ü = UE ß = ss
在 latin1_spanish_ci 排序中,
ñ(n-tilde) 是n和o之间的单独字母。 -
-
macroman(Mac 西欧) 排序:-
macroman_bin -
macroman_general_ci(默认)
macroroman已弃用,预计在未来 MySQL 版本中将被删除。 -
-
swe7(7位瑞典) 排序:-
swe7_bin -
swe7_swedish_ci(默认)
-