ISO 8859-1

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

ISO/IEC 8859-1, méně formálně ISO 8859-1 nebo ISO Latin-1 je osmibitová znaková sada používaná pro západoevropské jazyky, kterou vyvinula organizace Ecma International a publikovala jej spolu s Latin-2, Latin-3 a Latin-4 jako ECMA-94. Vývoj a udržování standardu později převzala Mezinárodní organizace pro normalizaci (ISO) společně s Mezinárodní elektrotechnickou komisí (IEC) jako první část standardu ISO/IEC 8859 zabývajícího se kódováním latinky. Je základem široce používaných znakových sad ISO-8859-1 (s pomlčkou za ISO) a Windows-1252. Rovněž prvních 256 znaků Unicode vychází z ISO 8859-1.

Pokrytí

Skládá se ze 191 znaků dovolujících (s výjimkou několika označených znaků) komunikovat následujícími jazyky:

* afrikánština * albánština * angličtina * baskičtina * bretonština * dánština * faerština * galicijština * indonéština * irština (nová ortografie) * islandština * italština * korsičtina * kurdština zapisovaná latinkou * leónština * lucemburština * manština * malajština * němčina * nizozemština (chybí dvojznak ij, ale ten by měl být v elektronické formě vždy reprezentován znaky IJ nebo ij) * norština (Bokmål a Nynorsk) * okcitánština * portugalština * rétorománština * skotská gaelština * svahilština * španělština * švédština * valonština

Jazyky s částečným pokrytím:

* estonština (chybí Š, š, Ž, ž používané v cizích slovech) ** Pozn. : Windows-1252 a ISO-8859-15 tyto znaky obsahují * francouzština (chybí ligatury Œ, œ a řídce užívaný znak Ÿ) ** Pozn. +more: Windows-1252 a ISO-8859-15 tyto znaky obsahují * finština (chybí Š, š, Ž, ž používané v cizích slovech) ** Pozn. : Windows-1252 a ISO-8859-15 tyto znaky obsahují * guaranština * katalánština * latina (chybí písmena s pruhem používaným ve slovnících a učebnicích pro vyjádření délky).

Některým jazykům chybí správné typografické uvozovky, protože jsou dostupné jen « », " ", a ' '.

V září 2015 používalo ISO 8859-1 přibližně 7.5% webových stránek.

Historie

ISO 8859-1 byl založen na mezinárodní sadě použité společností [url= hlaviček a definuje repertoár znaků povolený v dokumentech [[HyperText Markup Language|HTML][Digital Equipment Corporation]] v populárním terminálu VT220. Byl vyvinut v Ecma International, a publikován společně se standardy přijatými jako ISO/IEC 8859-2, ISO/IEC 8859-3 a ISO/IEC 8859-4 jako část specifikace [url=http://www. +moreecma-international. org/publications/files/ECMA-ST/Ecma-094. pdf]ECMA-94[/url], pod jejímž jménem se občas dosud uvádí.

ISO-8859-1 je (přinejmenším podle norem) implicitním kódováním dokumentů s MIME typem začínajícím „text/“ přenášených protokolem HTTP (pracovní verze standardu HTML 5 z roku 2010 vyžadovala, aby dokumenty s uvedeným kódováním ISO-8859-1 byly považovány za dokumenty v kódování Windows-1252) Je to implicitní kódování hodnot některých deskriptivních[/url]] verze 3. 2 (HTML 4. +more0 je založené na Unicode). Při absenci informací o kódování se o textových souborech v Unixu nebo Microsoft Windows často předpokládalo, že jsou v kódování ISO-8859-1, případně Windows-1252; teprve v poslední době se o takových textech předpokládá, že jsou v kódování Unicode, na unixových systémech obvykle UTF-8 na Microsoft Windows obvykle UTF-16.

Vztah k ISO/IEC 8859-15

V ISO/IEC 8859-1 chybí řídce užívané znaky Œ, œ a Ÿ pro francouzštinu, jednoznaková reprezentace písmene IJ, dva finské znaky pro transkripci některých cizích jmen (Š a Ž), typografické uvozovky a pomlčky, symbol eura (€) a křížek (†).

Proto byl vyvinut standard ISO/IEC 8859-15 jako aktualizace ISO 8859-1. To si vyžádalo odstranění některých méně frekventovaných symbolů ISO/IEC 8859-1, : ¤, ¦, ¨, ´, ¸, ¼, ½, a ¾.

Kódová tabulka

ISO/IEC 8859-1
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znaky
1xŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znakyŘídící znaky
2xSP. "#$%&'()*+,[[Pomlčka|-
3x0123456789:;[[Lomená závorka=>. +more
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ \ ^_
6x`abcdefghijklmno
7xpqrstuvwxyz ~
8xNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužíváno
9xNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužívánoNevyužíváno
AxNBSP¡¢£¤¥¦§¨©ª«¬SHY®¯
Bx°±²³´µ·¸¹º»¼½¾¿
CxÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏ
DxÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞß
Exàáâãäåæçèéêëìíîï
Fxðñòóôõö÷øùúûüýþÿ
.

Hodnoty 00-1F, 7F, a 80-9F nejsou v ISO/IEC 8859-1 přiřazeny. IANA kódování ISO-8859-1 doplňuje tyto kódy řídicími znaky ze řídicí sady C0 a C1.

Odkazy

Reference

Související články

ISO/IEC 8859-15 - úprava ISO-8859-1 * ISO/IEC 8859-2 - osmibitové kódování pro středo- a východoevropské jazyky * Unicode * ISO/IEC 10646 * UTF-8

Externí odkazy

[url=http://www. iso. +moreorg/iso/en/CatalogueDetailPage. CatalogueDetail. CSNUMBER=28245&ICS1=35&ICS2=40&ICS3=]ISO/IEC 8859-1:1998[/url] * [url=https://web. archive. org/web/20110514101319/http://anubis. dkuug. dk/JTC1/SC2/WG3/docs/n411. pdf]ISO/IEC 8859-1:1998[/url] - 8-bit single-byte coded graphic character sets, Part 1: Latin alphabet No. 1 (draft dated February 12, 1998, published April 15, 1998) * [url=http://www. ecma-international. org/publications/standards/Ecma-094. htm]Standard ECMA-94[/url]: 8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986) * [url=https://web. archive. org/web/20050522180151/http://www. itscj. ipsj. or. jp/ISO-IR/100. pdf]ISO-IR 100[/url] Right-Hand Part of Latin Alphabet No. 1 (February 1, 1986) * [url=http://msdn. microsoft. com/en-us/goglobal/bb964654. aspx]Windows Code pages[/url] * [url=http://www. alanwood. net/demos/charsetdiffs. html]Differences between ANSI, ISO-8859-1 and MacRoman Character Sets[/url] * [url=http://www. eki. ee/letter/]The Letter Database[/url] * [url=https://web. archive. org/web/20070514022715/http://www. bbsinc. com/iso8859. html]ASCII - ISO 8859-1 Table with HTML Entity Names[/url] * [url=http://czyborra. com/charsets/iso8859. html]The ISO 8859 Alphabet Soup[/url] - Roman Czyborra's history of ISO character sets.

Kategorie:Kódování znaků Kategorie:ISO/IEC 8859

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top