ISO 639-3

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

ISO 639-3 je třetí částí mezinárodního standardu ISO 639. Sestává ze 7 776 třípísmenných kódů světových jazyků. Jde o rozšíření standardu ISO 639-2 s cílem pokrýt všechny známé přirozené jazyky. Tato norma byla publikována Mezinárodní organizací pro normalizaci (ISO) 5. února 2007.

Využití standardu se předpokládá v řadě aplikací, především v počítačových systémech, které potřebují podporovat mnoho jazyků. Standard obsahuje co možná nejúplnější výčet jazyků živých i mrtvých, starověkých i umělých, světových i menšinových, psaných i nepsaných. +more Nezahrnuje ovšem rekonstruované jazyky jako je protoindoevropština.

Množina jazyků ISO 639-3 je nadmnožinou ISO 639-1. Z ISO 639-2 pokrývá všechny individuální jazyky, ale ne skupiny jazyků; pro individuální jazyky zastoupené v ISO 639-2 je kód ISO 639-3 stejný. +more Pro jazyky, které mají dva různé kódy ISO 639-2 (B a T), se v ISO 639-3 používá kód T („terminologický“; to je ten, který vychází z názvu jazyka v něm samém). Normy ISO 639-1 a -2 se zaměřovaly především na důležité jazyky, častěji zastoupené ve světové literatuře.

Příklady:

jazyk639-1639-2 (B/T)639-3 typ639-3 kód
angličtinaenengindividuálníeng
němčinadeger/deuindividuálnídeu
arabštinaararamakrojazykara
arabštinaararaindividuálníarb a jiné
minnanština

Hranice mezi jazykem a dialektem je v řadě případů předmětem sporů a norma ISO 639-3 je postupně rozšiřována. K dubnu 2012 obsahuje 7776 položek. +more Inventář jazyků je založen na několika zdrojích, mj. samostatné jazyky obsažené v ISO 639-2, moderní jazyky z Ethnologue, historické varianty, starověké jazyky a umělé jazyky od Anthony Aristara a z Linguist Listu. Další jazyky jsou doporučovány v každoročním období pro komentáře veřejnosti.

Kódový prostor

Protože každý kód je trojice malých písmen anglické abecedy, horní mez pro počet jazyků, které lze tímto způsobem reprezentovat, je 26 × 26 × 26 = 17 576. Protože je však vyloučeno užití kódů, které existují v ISO 639-2 a nebyly převzaty (4 zvláštní kódy, 520 kódů s rezervovaným využitím a 23 kódů typu B), musí se horní mez snížit na 17 030. +more K dalšímu snížení dojde po odečtení kódů kolekcí jazyků v ISO 639-2 a těch, které teprve budou definovány v ISO 639-5.

Makrojazyky

56 jazyků z ISO 639-2 se pro účely normy ISO 639-3 považují za „makrojazyky“, které někteří uživatelé v některých kontextech považují sice za samostatný jazyk, ale jejich varianty jsou natolik lingvisticky odlišné, že mohou být v jiných kontextech také považované za samostatný jazyk.

Některé z těchto makrojazyků, např. ara (arabština, různé druhy) jsou v ISO 639-3 rozděleny (existuje zde několik kódů pro jednotlivé varianty (jazyky) daného makrojazyka; celý makrojazyk může mít také svůj vlastní kód). +more Jiné, např. nor (norština) měly své varianty pokryté už v ISO 639-2 (v tomto případě nno (nynorsk) a nob (bokmål)). To znamená, že některé jazyky (např. arb, spisovná arabština), které byly v ISO 639-2 považovány za dialekty jednoho jazyka (ara), jsou nyní v ISO 639-3 v určitých kontextech považovány za samostatné jazyky.

Norma se tak snaží vypořádat s variantami, které se mohou lingvisticky lišit, ale jejich uživatelé s nimi zacházejí jako se dvěma formami téhož jazyka, např. v případě diglosie.

Na příklad: * http://www.sil.org/iso639-3/documentation.asp?id=ara (Obecná arabština, 639-2) * http://www.sil.org/iso639-3/documentation.asp?id=arb (Spisovná arabština, 639-3)

Pro úplný seznam viz .

Sdružené jazyky

„Kód sdruženého jazykového prvku je identifikátor, který zastupuje skupinu samostatných jazyků, které se nepovažují za jeden jazyk v žádném kontextu.“ Takové kódy nezastupují žádný samostatný jazyk ani makrojazyk.

Zatímco ISO 639-2 obsahuje třípísmenné sdružené kódy jazykových rodin, které bylo možné použít pro jazyky bez vlastního kódu, do ISO 639-3 tyto sdružené kódy zahrnuty nebyly. ISO 639-3 tedy není nadmnožinou ISO 639-2.

ISO 639-5 definuje třípísmenné sdružené kódy pro jazykové rodiny a skupiny.

Zvláštní kódy

Několik kódů je vyhrazeno pro zvláštní užití u jazyků, které nemají vlastní kód:

misjazyk bez vlastního kódu
mulsměs více jazyků
undneznámý jazyk
zxxnelingvistický obsah (třeba binární data)

Kódy qaa-qtz jsou „vyhrazeny pro vlastní užití“, např. pro vymřelé jazyky na Linguist Listu.

Využití ISO 639-3

Ethnologue, Linguist List * Jazyková značka IETF * Lexical Markup Framework, specifikace ISO pro reprezentaci strojově čitelných slovníků * Navrženo jako jazykové TLD (lcTLD)

Reference

Externí odkazy

[url=http://www. sil. +moreorg/iso639-3/]Registrační úřad ISO 639-3[/url] * [url=http://www. loc. gov/standards/iso639-2/faq. html]FAQ[/url] na stránkách americké Library of Congress * [url=http://www. sil. org/iso639-3/chg_requests. asp. order=lang_grp&chg_status=current]Připravované aplikace ISO 639-3[/url] * [url=http://linguistlist. org/forms/langs/get-extinct. cfm]Linguist List - Seznam starověkých a vymřelých jazyků[/url] * [url=https://web. archive. org/web/20040618170414/http://eikenes. alvestrand. no/pipermail/ietf-languages/2003-November/001589. html]Vysvětlení Håvard Hjulstada[/url].

Kategorie:ISO 639

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top