Windows-1252

Windows-1252 nebo CP-1252 je znaková sada pouà ¾ÃÂvaná implicitnàve starà ¡ÃÂch verzÃÂch Microsoft Windows pro angliÃÂtinu a nÃÂkteré dalà ¡Ã západoevropské jazyky. Patà Âàmezi kódové stránky systému Windows.
Detaily
ZatÃÂmco kódovánàIANA ISO-8859-1 obsazuje kódy 0x80 aà ¾ 0x9F à ÂÃÂdicÃÂmi znaky z à ÂÃÂdicàsady C1, Windows-1252 pouà ¾ÃÂvá tyto kódy pro tisknutelné znaky. Z pohledu tisknutelných znakà ¯ a dÃÂky minimálnÃÂmu pouà ¾ÃÂvánàà ÂÃÂdicÃÂch znakà ¯ ze sady C1 bývá Windows-1252 povaà ¾ováno za nadmnoà ¾inu kódovánàISO 8859-1. Z pà Âidaných znakà ¯ jsou významné jednoduché a dvojité uvozovky, znak Euro a và ¡echny tisknutelné znaky, které jsou (s jinými kódy) v ISO 8859-15. V Microsoft Windows se oznaÃÂuje jako kódová stránka ÃÂÃÂslo 1252, IANA pouà ¾ÃÂvá oznaÃÂenàâÂÂwindows-1252âÂÂ.
Velmi ÃÂasto je kódovánàWindows-1252 oznaÃÂováno jako ISO-8859-1. Obvyklým dÃ
¯sledkem bylo, Ã
¾e vÃ
¡echny uvozovky a apostrofy (vytvoÃ
Âené ve slovnÃÂch procesorech funkcàâÂÂsmart quotesâÂÂ) byly na jiných operaÃÂnÃÂch systémech neÃ
¾ Windows nahrazeny otaznÃÂky nebo ÃÂtvereÃÂky, coÃ
¾ ztÃÂÃ
¾ovalo ÃÂtenàtextu. VÃÂtÃ
¡ina modernÃÂch WWW prohlÃÂÃ
¾eÃÂÃ
¯ a klientÃ
¯ pro e-mail zobrazuje MIME charset=ISO-8859-1 jako Windows-1252, aby zobrazovaly takto chybnàoznaÃÂené texty správnÃÂ. Okolo roku 2010 to bylo standardnàchovánàv HTML 5, které vyÃ
¾adovalo, aby dokumenty oznaÃÂené jako ISO-8859-1 byly skuteÃÂnàanalyzovány s kódovánÃÂm Windows-1252.[1] V dubnu 2017 uvádÃÂlo kódovánàWindows-1252 0,8 % WWW stránek,[2][3] ale 5,2 % stránek pouÃ
¾ÃÂvalo ISO-8859-1, které by podle norem HTML5 mÃÂly být povaÃ
¾ovány za stejné kódovánÃÂ, takÃ
¾e lze Ã
ÂÃÂct, Ã
¾e efektivnà6 % WWW stránek pouÃ
¾ÃÂvá kódovánàWindows-1252.
OznaÃÂenàâÂÂANSI Code Pageâ (ACP) se historicky pouà ¾ÃÂvalo ve Windows pro oznaÃÂenàrà ¯zných kódových stránek povaà ¾ovaných za nativnÃÂ. Pà ¯vodnÃÂm úmyslem bylo zaregistrovat vÃÂtà ¡inu kódových stránek jako ANSI standard podobnàjako ISO/IEC 8859-1. Ale ani prvnàa zdaleka nejpouà ¾ÃÂvanÃÂjà ¡Ã takto pojmenovaná kódová stránka, kterou je právàWindows-1252, nebyla nikdy ANSI standardem. Microsoft pÃÂà ¡e: âÂÂPouà ¾ÃÂvánàtermÃÂnu ANSI pro oznaÃÂenàkódových stránek Windows je pà Âekonané, nynànevhodné, ale v komunitàuà ¾ivatelà ¯ Windows pà Âetrvává.âÂÂ[4]
V systému LaTeX je kódovánàCP-1252 oznaÃÂovano jako âÂÂansinewâÂÂ.
Struktura kódové stránky
NásledujÃÂcàtabulka zobrazuje kódovánàWindows-1252. U kaà ¾dého znaku je uveden jeho kódový bod Unicode a desÃÂtkový kód. Konverze do Unicode vycházejàz mapovánàWindows-1252 s âÂÂbest fitâ uvedeného na serveru Unicode.org.[5]
VysvÃÂtlivky:
|
|
  Alfabetický znak
  Ã
ÂÃÂdicÃÂ znak
  ÃÂÃÂslice
  Interpunkce
|
  RozÃ
¡ÃÂÃ
Âená interpunkce
  Grafický znak
  Mezinárodnàznak
  Nedefinováno
|
|
  RozdÃÂly oproti ISO-8859-1
|
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Â 0_ Â |
NUL 0000 0 |
SOH 0001 1 |
STX 0002 2 |
ETX 0003 3 |
EOT 0004 4 |
ENQ 0005 5 |
ACK 0006 6 |
BEL 0007 7 |
BS 0008 8 |
HT 0009 9 |
LF 000A 10 |
VT 000B 11 |
FF 000C 12 |
CR 000D 13 |
SO 000E 14 |
SI 000F 15 |
| Â 1_ Â |
DLE 0010 16 |
DC1 0011 17 |
DC2 0012 18 |
DC3 0013 19 |
DC4 0014 20 |
NAK 0015 21 |
SYN 0016 22 |
ETB 0017 23 |
CAN 0018 24 |
EM 0019 25 |
SUB 001A 26 |
ESC 001B 27 |
FS 001C 28 |
GS 001D 29 |
RS 001E 30 |
US 001F 31 |
| Â 2_ Â |
SP 0020 32 |
! 0021 33 |
" 0022 34 |
# 0023 35 |
$ 0024 36 |
% 0025 37 |
& 0026 38 |
' 0027 39 |
( 0028 40 |
) 0029 41 |
* 002A 42 |
+ 002B 43 |
, 002C 44 |
- 002D 45 |
. 002E 46 |
/ 002F 47 |
| Â 3_ Â |
0 0030 48 |
1 0031 49 |
2 0032 50 |
3 0033 51 |
4 0034 52 |
5 0035 53 |
6 0036 54 |
7 0037 55 |
8 0038 56 |
9 0039 57 |
: 003A 58 |
; 003B 59 |
< 003C 60 |
= 003D 61 |
> 003E 62 |
? 003F 63 |
| Â 4_ Â |
Zavináà0040 64 |
A 0041 65 |
B 0042 66 |
C 0043 67 |
D 0044 68 |
E 0045 69 |
F 0046 70 |
G 0047 71 |
H 0048 72 |
I 0049 73 |
J 004A 74 |
K 004B 75 |
L 004C 76 |
M 004D 77 |
N 004E 78 |
O 004F 79 |
| Â 5_ Â |
P 0050 80 |
Q 0051 81 |
R 0052 82 |
S 0053 83 |
T 0054 84 |
U 0055 85 |
V 0056 86 |
W 0057 87 |
X 0058 88 |
Y 0059 89 |
Z 005A 90 |
[ 005B 91 |
\ 005C 92 |
] 005D 93 |
^ 005E 94 |
_ 005F 95 |
| Â 6_ Â |
` 0060 96 |
a 0061 97 |
b 0062 98 |
c 0063 99 |
d 0064 100 |
e 0065 101 |
f 0066 102 |
g 0067 103 |
h 0068 104 |
i 0069 105 |
j 006A 106 |
k 006B 107 |
l 006C 108 |
m 006D 109 |
n 006E 110 |
o 006F 111 |
| Â 7_ Â |
p 0070 112 |
q 0071 113 |
r 0072 114 |
s 0073 115 |
t 0074 116 |
u 0075 117 |
v 0076 118 |
w 0077 119 |
x 0078 120 |
y 0079 121 |
z 007A 122 |
{ 007B 123 |
| 007C 124 |
} 007D 125 |
~ 007E 126 |
DEL 007F 127 |
| Â 8_ Â |
⬠20AC 128 |
 | â 201A 130 |
ÃÂ 0192 131 |
â 201E 132 |
⦠2026 133 |
â 2020 134 |
â¡ 2021 135 |
ÃÂ 02C6 136 |
â° 2030 137 |
Ã
 0160 138 |
â¹ 2039 139 |
Ã
 0152 140 |
 | Ã
½ 017D 142 |
 |
| Â 9_ Â |
 | â 2018 145 |
â 2019 146 |
â 201C 147 |
â 201D 148 |
⢠2022 149 |
â 2013 150 |
â 2014 151 |
ÃÂ 02DC 152 |
⢠2122 153 |
Ã
¡ 0161 154 |
⺠203A 155 |
Ã
 0153 156 |
 | Ã
¾ 017E 158 |
Ã
¸ 0178 159 |
| Â A_ Â |
NBSP 00A0 160 |
á 00A1 161 |
â 00A2 162 |
ã 00A3 163 |
ä 00A4 164 |
ÃÂ¥ 00A5 165 |
æ 00A6 166 |
ç 00A7 167 |
è 00A8 168 |
é 00A9 169 |
ê 00AA 170 |
ë 00AB 171 |
ì 00AC 172 |
SHY 00AD 173 |
î 00AE 174 |
ï 00AF 175 |
| Â B_ Â |
ð 00B0 176 |
ñ 00B1 177 |
ò 00B2 178 |
ó 00B3 179 |
ô 00B4 180 |
õ 00B5 181 |
ö 00B6 182 |
÷ 00B7 183 |
ø 00B8 184 |
ù 00B9 185 |
ú 00BA 186 |
û 00BB 187 |
ü 00BC 188 |
ý 00BD 189 |
þ 00BE 190 |
ÿ 00BF 191 |
| Â C_ Â |
ÃÂ 00C0 192 |
ÃÂ 00C1 193 |
ÃÂ 00C2 194 |
ÃÂ 00C3 195 |
ÃÂ 00C4 196 |
ÃÂ
00C5 197 |
ÃÂ 00C6 198 |
ÃÂ 00C7 199 |
ÃÂ 00C8 200 |
ÃÂ 00C9 201 |
ÃÂ 00CA 202 |
ÃÂ 00CB 203 |
ÃÂ 00CC 204 |
ÃÂ 00CD 205 |
ÃÂ 00CE 206 |
ÃÂ 00CF 207 |
| Â D_ Â |
ÃÂ 00D0 208 |
ÃÂ 00D1 209 |
ÃÂ 00D2 210 |
ÃÂ 00D3 211 |
ÃÂ 00D4 212 |
ÃÂ 00D5 213 |
ÃÂ 00D6 214 |
ÃÂ 00D7 215 |
ÃÂ 00D8 216 |
ÃÂ 00D9 217 |
ÃÂ 00DA 218 |
ÃÂ 00DB 219 |
ÃÂ 00DC 220 |
ÃÂ 00DD 221 |
ÃÂ 00DE 222 |
ÃÂ 00DF 223 |
| Â E_ Â |
ÃÂ 00E0 224 |
á 00E1 225 |
â 00E2 226 |
ã 00E3 227 |
ä 00E4 228 |
ÃÂ¥ 00E5 229 |
æ 00E6 230 |
ç 00E7 231 |
è 00E8 232 |
é 00E9 233 |
ê 00EA 234 |
ë 00EB 235 |
ì 00EC 236 |
ÃÂ 00ED 237 |
î 00EE 238 |
ï 00EF 239 |
| Â F_ Â |
ð 00F0 240 |
ñ 00F1 241 |
ò 00F2 242 |
ó 00F3 243 |
ô 00F4 244 |
õ 00F5 245 |
ö 00F6 246 |
÷ 00F7 247 |
ø 00F8 248 |
ù 00F9 249 |
ú 00FA 250 |
û 00FB 251 |
ü 00FC 252 |
ý 00FD 253 |
þ 00FE 254 |
ÿ 00FF 255 |
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F |
Podle informacÃÂ z webÃ
¯ firmy Microsoft a Unicode Consortia nejsou kódy 0x81, 0x8D, 0x8F, 0x90 a 0x9D pouÃ
¾ité; Windows API MultiByteToWideChar je vÃ
¡ak pÃ
Âevádàna odpovÃÂdajÃÂcàznaky z Ã
ÂÃÂdicàsady C1. Toto chovánàje zdokumentováno i v âÂÂbest fitâ mapovánÃÂ.[5]
Historie
- V prvnàverzi kódové stránky 1252 pouà ¾ÃÂvané v Microsoft Windows 1.0 nebyly definované pozice 0xD7 a 0xF7 a celý rozsah 0x80-0x9F.
- Ve druhé verzi pouà ¾ÃÂvané v Microsoft Windows 2.0 byly novàdefinované kódy 0x91, 0x92, 0xD7 a 0xF7.
- Tà Âetàverze pouà ¾ÃÂvaná od Microsoft Windows 3.1, mÃÂla definované và ¡echny pozice kromàznaku Eura a dvojice znakà ¯ Z s háÃÂkem.
- Poslednàverze, která je popsána vÃ½à ¡e, se objevila v Microsoft Windows 98 a v rámci updatu doplà ÂujÃÂcÃÂho znak Eura byla portována i na starà ¡Ã verze Windows.
Odkazy
Reference
V tomto ÃÂlánku byl pouà ¾it pà Âeklad textu z ÃÂlánku Windows-1252 na anglické Wikipedii.
- â Encoding [online]. WHATWG, 2015-01-27 [cit. 2015-02-04]. Dostupné v archivu poà ÂÃÂzeném dne 2015-02-04.
- â Historical trends in the usage of character encodings, October 2016 [online]. Dostupné online.
- â Frequenty Asked Questions [online]. Dostupné online.
- â WISSINK, Cathy. Unicode a Windows XP [online]. Microsoft, 2002-04-05 [cit. 2015-02-04]. Dostupné v archivu poà ÂÃÂzeném dne 2015-02-04.
- â a b ZobrazenàWindows-1252 na Unicode s Best Fit [online]. Unicode [cit. 2015-02-04]. Dostupné v archivu poà ÂÃÂzeném z originálu dne 2015-02-04.
SouvisejÃÂcàÃÂlánky
- Kódovánàznakà ¯ pro západoevropské jazyky
- Windows-1250