Windows-1250

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Windows-1250, někdy také CP-1250, je znaková sada používaná operačním systémem Microsoft Windows pro reprezentaci textů ve středoevropských jazycích používajících latinku - např. pro albánštinu, chorvatštinu, češtinu, polštinu, rumunštinu, slovenštinu a maďarštinu. Tuto stránku je rovněž možné použít pro kódování německých textů; při tomto kódování budou německé texty identické jako při použití sady Windows-1252.

Podobnost se sadou ISO 8859-2

Windows-1250 se podobá sadě ISO 8859-2 - obsahuje všechny její tisknutelné znaky (a ještě několik navíc), ale několik z nich je na jiných místech (na rozdíl od Windows-1252, kde jsou všechny tisknutelné znaky na stejném místě jako v ISO 8859-1). Je to pravděpodobně způsobeno snahou o zachování stejného rozložení se sadou Windows-1252. +more Rozdíly zachycuje následující tabulka.

Dle http://www. cestina. +morecz/whyISO. html došlo k tomuto proházení znaků a tím k velkým problémům s kompatibilitou záměrně v rámci konkurenčního boje. Jedná se jen o jeden z argumentů, ale v té době by to bylo opravdu reálné a pravdu už asi nikdo nezjistí.

To bylo totiž tak. Microsoft potřeboval udělat do Windows 3. +more0 podporu pro východoevropské jazyky používající latinku, a tak nechali SWS (Software Slušovice), aby jí vyvinul. SWS vytvořil podporu používající kódování na bázi ISO-8859-2, s tím, že v místech řídících znaků (128-159), které ve Windows nejsou potřebné, byly semigrafické symboly. Tuto podporu odeslal Microsoftu. Jaké však bylo překvapení lidí v SWS když zjistili, že v nových Windows 3. 1 byly některé znaky (např. ž,š,ť) přesunuty do řídící oblasti z jejich původních pozic v kódování ISO-8859-2. Tak vznikla kódová stránka CP-1250. Důvodem, který pravděpodobně vedl Microsoft k tomuto kroku byl konkurenční boj vůči Unixu -- záměrně vytvořili nekompatibilitu se kterou se my dnes musíme potýkat. Kódování západoevropských Windows (CP1252) se od ISO-8859-1 téměř neliší, protože vzniklo podobným způsobem z ISO-8859-1, ovšem bez onoho prohazovacího podrazu, neboť v Západní Evropě byl Unix etablovaný a něco takového si Microsoft nemohl dovolit.

Srovnání s ISO 8859-2

0x80128ŘZ0xA0160 0xC0192Ŕ0xE0224ŕ
0x81129NZŘZ0xA1161ˇĄ0xC1193ÁÁ0xE1225áá
0x82130ŘZ0xA2162˘˘0xC2194ÂÂ0xE2226ââ
0x83131NZŘZ0xA3163ŁŁ0xC3195ĂĂ0xE3227ăă
0x84132ŘZ0xA4164¤¤0xC4196ÄÄ0xE4228ää
0x85133ŘZ0xA5165ĄĽ0xC5197ĹĹ0xE5229ĺĺ
0x86134ŘZ0xA6166¦Ś0xC6198ĆĆ0xE6230ćć
0x87135ŘZ0xA7167§§0xC7199ÇÇ0xE7231çç
0x88136NZŘZ0xA8168¨¨0xC8200ČČ0xE8232čč
0x89137ŘZ0xA9169©Š0xC9201ÉÉ0xE9233éé
0x8A138ŠŘZ0xAA170ŞŞ0xCA202ĘĘ0xEA234ęę
0x8B139ŘZ0xAB171«Ť0xCB203ËË0xEB235ëë
0x8C140ŚŘZ0xAC172¬Ź0xCC204ĚĚ0xEC236ěě
0x8D141ŤŘZ0xAD173­­0xCD205ÍÍ0xED237íí
0x8E142ŽŘZ0xAE174®Ž0xCE206ÎÎ0xEE238îî
0x8F143ŹŘZ0xAF175ŻŻ0xCF207ĎĎ0xEF239ďď
0x90144NZŘZ0xB0176°°0xD0208ĐĐ0xF0240đđ
0x91145ŘZ0xB1177±ą0xD1209ŃŃ0xF1241ńń
0x92146ŘZ0xB2178˛˛0xD2210ŇŇ0xF2242ňň
0x93147ŘZ0xB3179łł0xD3211ÓÓ0xF3243óó
0x94148ŘZ0xB4180´´0xD4212ÔÔ0xF4244ôô
0x95149ŘZ0xB5181µľ0xD5213ŐŐ0xF5245őő
0x96150-ŘZ0xB6182ś0xD6214ÖÖ0xF6246öö
0x97151-ŘZ0xB7183·ˇ0xD7215××0xF7247÷÷
0x98152NZŘZ0xB8184¸¸0xD8216ŘŘ0xF8248řř
0x99153ŘZ0xB9185ąš0xD9217ŮŮ0xF9249ůů
0x9A154šŘZ0xBA186şş0xDA218ÚÚ0xFA250úú
0x9B155ŘZ0xBB187»ť0xDB219ŰŰ0xFB251űű
0x9C156śŘZ0xBC188Ľź0xDC220ÜÜ0xFC252üü
0x9D157ťŘZ0xBD189˝˝0xDD221ÝÝ0xFD253ýý
0x9E158žŘZ0xBE190ľž0xDE222ŢŢ0xFE254ţţ
0x9F159źŘZ0xBF191żż0xDF223ßß0xFF255˙˙

Kde „NZ” označuje znak nedefinovaný v tomto kódování, „ŘZ” označuje řídicí znak, a „Znak” označuje znak společný pro obě kódování.

Kódová tabulka

Následující tabulka obsahuje znaky Windows-1250 a jejich šestnáctkové kódy.

0xŘídicí znaky
1x
2xSP. "#$%&'()*+,[[Znak minus|- | . +more/
3x0123456789:;[[Lomená závorka=>.
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ \ ^_
6x`abcdefghijklmno
7xpqrstuvwxyz | ~ZK
8xNZNZNZŠŚŤŽŹ
9xNZ[[pomlčka|- | [[pomlčka|- | | NZ | šśťžź
AxNBSPˇ˘Ł¤Ą¦§¨©Ş«¬SHY®Ż
Bx°±˛ł´µ·¸ąş»Ľ˝ľż
CxŔÁÂĂÄĹĆÇČÉĘËĚÍÎĎ
DxĐŃŇÓÔŐÖ×ŘŮÚŰÜÝŢß
Exŕáâăäĺćçčéęëěíîď
Fxđńňóôőö÷řůúűüýţ˙
.

Ve výše uvedené tabulce je znak s kódem 0x20 obyčejná mezera, 0xA0 je nezlomitelná mezera, znak 0xAD jest měkký rozdělovník.

Mapování do Unikódu

Následující tabulka obsahuje převod z Windows-1250 do Unicode.

HexZnakUnicodeHexZnakUnicodeHexZnakUnicodeHexZnakUnicode
0x80U+20AC0xA0NBSPU+00A00xC0ŔU+01540xE0ŕU+0155
0x81NZNZ0xA1ˇU+02C70xC1ÁU+00C10xE1áU+00E1
0x82U+201A0xA2˘U+02D80xC2ÂU+00C20xE2âU+00E2
0x83NZNZ0xA3ŁU+01410xC3ĂU+01020xE3ăU+0103
0x84U+201E0xA4¤U+00A40xC4ÄU+00C40xE4äU+00E4
0x85U+20260xA5ĄU+01040xC5ĹU+01390xE5ĺU+013A
0x86U+20200xA6¦U+00A60xC6ĆU+01060xE6ćU+0107
0x87U+20210xA7§U+00A70xC7ÇU+00C70xE7çU+00E7
0x88NZNZ0xA8¨U+00A80xC8ČU+010C0xE8čU+010D
0x89U+20300xA9©U+00A90xC9ÉU+00C90xE9éU+00E9
0x8AŠU+01600xAAŞU+015E0xCAĘU+01180xEAęU+0119
0x8BU+20390xAB«U+00AB0xCBËU+00CB0xEBëU+00EB
0x8CŚU+015A0xAC¬U+00AC0xCCĚU+011A0xECěU+011B
0x8DŤU+01640xADSHYU+00AD0xCDÍU+00CD0xEDíU+00ED
0x8EŽU+017D0xAE®U+00AE0xCEÎU+00CE0xEEîU+00EE
0x8FŹU+01790xAFŻU+017B0xCFĎU+010E0xEFďU+010F
0x90NZNZ0xB0°U+00B00xD0ĐU+01100xF0đU+0111
0x91U+20180xB1±U+00B10xD1ŃU+01430xF1ńU+0144
0x92U+20190xB2˛U+02DB0xD2ŇU+01470xF2ňU+0148
0x93U+201C0xB3łU+01420xD3ÓU+00D30xF3óU+00F3
0x94U+201D0xB4´U+00B40xD4ÔU+00D40xF4ôU+00F4
0x95U+20220xB5µU+00B50xD5ŐU+01500xF5őU+0151
0x96-U+20130xB6U+00B60xD6ÖU+00D60xF6öU+00F6
0x97-U+20140xB7·U+00B70xD7×U+00D70xF7÷U+00F7
0x98NZNZ0xB8¸U+00B80xD8ŘU+01580xF8řU+0159
0x99U+21220xB9ąU+01050xD9ŮU+016E0xF9ůU+016F
0x9AšU+01610xBAşU+015F0xDAÚU+00DA0xFAúU+00FA
0x9BU+203A0xBB»U+00BB0xDBŰU+01700xFBűU+0171
0x9CśU+015B0xBCĽU+013D0xDCÜU+00DC0xFCüU+00FC
0x9DťU+01650xBD˝U+02DD0xDDÝU+00DD0xFDýU+00FD
0x9EžU+017E0xBEľU+013E0xDEŢU+01620xFEţU+0163
0x9FźU+017A0xBFżU+017C0xDFßU+00DF0xFF˙U+02D9

Kódování řídících znaků

0x00NULL
0x01START OF HEADING
0x02START OF TEXT
0x03END OF TEXT
0x04END OF TRANSMISSION
0x05ENQUIRY
0x06ACKNOWLEDGE
0x07BELL
0x08BACKSPACE
0x09HORIZONTAL TABULATION
0x0ALINE FEED
0x0BVERTICAL TABULATION
0x0CFORM FEED
0x0DCARRIAGE RETURN
0x0ESHIFT OUT
0x0FSHIFT IN
0x10DATA LINK ESCAPE
0x11DEVICE CONTROL ONE
0x12DEVICE CONTROL TWO
0x13DEVICE CONTROL THREE
0x14DEVICE CONTROL FOUR
0x15NEGATIVE ACKNOWLEDGE
0x16SYNCHRONOUS IDLE
0x17END OF TRANSMISSION BLOCK
0x18CANCEL
0x19END OF MEDIUM
0x1ASUBSTITUTE
0x1BESCAPE
0x1CFILE SEPARATOR
0x1DGROUP SEPARATOR
0x1ERECORD SEPARATOR
0x1FUNIT SEPARATOR

Odkazy

Související články

Kódování češtiny * Windows-1252

Externí odkazy

[url=://www. cestina. +morecz/kodovani/#CP1250 * [ftp://ftp. unicode. org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1250. TXT cp1250 to Unicode table]url=http://www. microsoft. com/typography/unicode/1250. htm]Výrobce o Windows-1250[/url] * Přehled kódování češtiny, Windows-1250:[/url].

Kategorie:Kódování češtiny Kategorie:Kódové stránky v systému Windows

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top