ISO 8859-2

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

ISO 8859-2, formálně správně ISO/IEC 8859-2, je v informatice znaková sada známá rovněž jako Latin-2 (pozor na možnou záměnu použití pojmu Latin-2 v prostředí Microsoft Windows v prostředí MS DOS, viz CP852), nebo „středo-“ či „východoevropská“, která je druhou částí standardního kódování znaků definovaného organizací ISO. Obsahuje 191 znaků latinky kódovaných pomocí 8 bitů a poprvé byla publikována v roce 1987.

Pokrytí jazyků

Pomocí této znakové sady je možné zapisovat texty následujících jazycích: bosenština, chorvatština, čeština, maďarština, polština, rumunština, srbština (psaná v latinské transkripci), srbochorvatština, slovenština, slovinština, hornolužičtina, dolnolužičtina. Jako dodatkové jazyky lze použít angličtinu a němčinu, což má význam zvláště ve vícejazyčných dokumentech (pro tyto jazyky se normálně upřednostňuje ISO 8859-1).

Na rozdíl od ISO 8859-1 je tato sestava znaků použitelná i pro finštinu (kromě znaku „å“ používaného v některých švédsko-finských jménech) a němčinu. Sporné je zde použití pro rumunštinu, protože místo znaků Șș i Țț (S a T s čárkou) se musí použít znaky Şş i Ţţ (S a T s cedillou). +more Toto omezení se dostalo i do první verze unikódu, kde zobrazení s cedillou nebo tečkou bylo bráno jako výběr fontu a ne jako oddělené znaky. Unicode 3. 0 již obsahuje správné rumunské znaky.

Latin 2

Tato kódová stránka bývá často nazývána Latin 2, nicméně stejné označení se používá v MS-DOSu pro CP852. Někdy tak dochází k omylům, kterým se lze vyhnout označováním ISO 8859-2 jako ISO Latin 2, zatímco CP852 lze nazývat PC Latin 2 nebo IBM Latin 2. +more [http://www. cestina. cz/kodovani/#CP852].

Podobnost s Windows-1250

ISO 8859-2 se velmi podobá znakové sadě Windows-1250, která vznikla později. Kódování Windows-1250 zavedené firmou Microsoft obsahuje všechny tisknutelné znaky ISO 8859-2, ale některé z nich na jiných místech. +more V češtině je tento rozdíl nejmarkantnější u písmen Š, Ť a Ž.

Tabulka znaků

ISO/IEC 8859-2:1999
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znaky
1xŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znaky
2xSP. "#$%&'()*+,[[Pomlčka|-
3x0123456789:;[[Lomená závorka=>. +more
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ \ ^_
6x`abcdefghijklmno
7xpqrstuvwxyz ~
8xNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužíváno
9xNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužíváno
AxNBSPĄ˘Ł¤ĽŚ§¨ŠŞŤŹSHYŽŻ
Bx°ą˛ł´ľśˇ¸šşťź˝žż
CxŔÁÂĂÄĹĆÇČÉĘËĚÍÎĎ
DxĐŃŇÓÔŐÖ×ŘŮÚŰÜÝŢß
Exŕáâăäĺćçčéęëěíîď
Fxđńňóôőö÷řůúűüýţ˙
.

Znak s kódem 0x20 je obyčejná mezera, 0xA0 je nezlomitelná mezera, znak 0xAD měkký rozdělovník.

Mapování do Unikódu

ISO/IEC 8859-2:1999
HexZnakUnicodeHexZnakUnicodeHexZnakUnicodeHexZnakUnicode
0x80ŘZU+00800xA0NBSPU+00A00xC0ŔU+01540xE0ŕU+0155
0x81ŘZU+00810xA1ĄU+01040xC1ÁU+00C10xE1áU+00E1
0x82ŘZU+00820xA2˘U+02D80xC2ÂU+00C20xE2âU+00E2
0x83ŘZU+00830xA3ŁU+01410xC3ĂU+01020xE3ăU+0103
0x84ŘZU+00840xA4¤U+00A40xC4ÄU+00C40xE4äU+00E4
0x85ŘZU+00850xA5ĽU+013D0xC5ĹU+01390xE5ĺU+013A
0x86ŘZU+00860xA6ŚU+015A0xC6ĆU+01060xE6ćU+0107
0x87ŘZU+00870xA7§U+00A70xC7ÇU+00C70xE7çU+00E7
0x88ŘZU+00880xA8¨U+00A80xC8ČU+010C0xE8čU+010D
0x89ŘZU+00890xA9ŠU+01600xC9ÉU+00C90xE9éU+00E9
0x8AŘZU+008A0xAAŞU+015E0xCAĘU+01180xEAęU+0119
0x8BŘZU+008B0xABŤU+01640xCBËU+00CB0xEBëU+00EB
0x8CŘZU+008C0xACŹU+01790xCCĚU+011A0xECěU+011B
0x8DŘZU+008D0xADSHYU+00AD0xCDÍU+00CD0xEDíU+00ED
0x8EŘZU+008E0xAEŽU+017D0xCEÎU+00CE0xEEîU+00EE
0x8FŘZU+008F0xAFŻU+017B0xCFĎU+010E0xEFďU+010F
0x90ŘZU+00900xB0°U+00B00xD0ĐU+01100xF0đU+0111
0x91ŘZU+00910xB1ąU+01050xD1ŃU+01430xF1ńU+0144
0x92ŘZU+00920xB2˛U+02DB0xD2ŇU+01470xF2ňU+0148
0x93ŘZU+00930xB3łU+01420xD3ÓU+00D30xF3óU+00F3
0x94ŘZU+00940xB4´U+00B40xD4ÔU+00D40xF4ôU+00F4
0x95ŘZU+00950xB5ľU+013E0xD5ŐU+01500xF5őU+0151
0x96ŘZU+00960xB6śU+015B0xD6ÖU+00D60xF6öU+00F6
0x97ŘZU+00970xB7ˇU+02C70xD7×U+00D70xF7÷U+00F7
0x98ŘZU+00980xB8¸U+00B80xD8ŘU+01580xF8řU+0159
0x99ŘZU+00990xB9šU+01610xD9ŮU+016E0xF9ůU+016F
0x9AŘZU+009A0xBAşU+015F0xDAÚU+00DA0xFAúU+00FA
0x9BŘZU+009B0xBBťU+01650xDBŰU+01700xFBűU+0171
0x9CŘZU+009C0xBCźU+017A0xDCÜU+00DC0xFCüU+00FC
0x9DŘZU+009D0xBD˝U+02DD0xDDÝU+00DD0xFDýU+00FD
0x9EŘZU+009E0xBEžU+017E0xDEŢU+01620xFEţU+0163
0x9FŘZU+009F0xBFżU+017C0xDFßU+00DF0xFF˙U+02D9

Kde „ŘZ“ označuje řídící znak.

Externí odkazy

[url=http://www. iso. +moreorg/iso/en/CatalogueDetailPage. CatalogueDetail. CSNUMBER=28246&ICS1=35&ICS2=40&ICS3=]ISO 8859-2:1999[/url] * [url=http://www. ecma-international. org/publications/standards/Ecma-094. htm]Standard ECMA-94[/url]: 8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986) * [url=https://web. archive. org/web/20030917221957/http://www. itscj. ipsj. or. jp/ISO-IR/101. pdf]ISO-IR 101[/url] Right-Hand Part of Latin Alphabet No. 2 (February 1, 1986).

Kategorie:Kódování znaků Kategorie:ISO/IEC 8859

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top