JIS X 0208

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

JIS X 0208 je japonská průmyslová norma (první část zkratky je z anglického ) pro dvoubytové kódování znaků, která definuje 6879 grafických znaků vhodných pro zápis textu, místních názvů, osobních jmen atd. v japonštině. Oficiální název normy je „7bitové a 8bitové dvoubytové kódování kandži pro výměnu informací“ . První verze normy byla publikována v roce 1978 pod označením JIS C 6226, revize byly vydány v letech 1983, 1990 (již pod označením JIS X 0208) a 1997.

Struktura kódu

Kódy znaků v JIS X 0208 jsou tvořeny dvěma sedmi- nebo osmibitovými hodnotami. Znak mezera a řídicí znaky jsou však reprezentovány jednobytovými kódy. +more ISO/IEC 646 rozděluje prostor sedmibitového kódu na 33 řídicích znaků, 94 tisknutelných znaků a znak mezera. Pokud vynecháme kódy řídicích znaků a mezery, lze při použití dvou bytů reprezentovat až 8836 (94×94) znaků; u dvoubytových znakových sad se kódový bod každého znaku zadává ve formě zvané kuten (japonsky: ) (někdy nazývaného quwei (čínsky: ), zvláště když pracujeme s kódováním GB2312 a příbuznými standardy), který určuje zónu neboli řádek ( japonsky: ku, čínsky: qu) a pozici (japonsky: ten) (čínsky: wei) tohoto znaku v zóně/řádku.

Znaková sada

JIS X 0208 definuje sadu celkem 6879 grafických znaků, nazývanou sada kandži , která však kromě 6355 kandži znaků obsahuje a 524 dalších znaků , včetně znaků jiných abeced - latinky, řecké abecedy, Cyrilice, kana atd. Znakům jsou přiřazeny dvoubytové kódy se sedmi anebo osmi bity v bytu rozdělené do 94 řádků neboli zón po 94 pozicích.

Speciální znaky :Jsou umístěny v řádcích 1 a 2. Zahrnují :* 18 popisných symbolů , jako například „ideografická mezera“ ( ) a japonskou čárku a tečku; :* 8 diakritických znamének jako například dakuten a handakuten; :* 10 znaků pro věci, které následují kana nebo kandži jako například znak opakování; :* 22 závorkových symbolů ; :* 45 matematických symbolů ; :* 32 symbolů jednotek, které zahrnují znak měny a japonský znak pošty; :- celkem 147 znaků. +more Číslice :Jsou umístěny v řádku 3. Deset číslic od „0“ do „9“. Latinka :Umístěna v řádku 3. 26 malých a 26 velkých písmen anglické abecedy. Hiragana :Umístěna v řádku 4. Obsahuje 48 neznělých (včetně zastaralých wi a we), 20 znělých (dakuten), 5 poloznělých (handakuten) a 10 malých znaků kana pro palatalizované a asimilované zvuky; celkem 83 znaků. Katakana :Umístěna v řádku 5. Celkem 86 znaků; kromě katakana ekvivalentů hiragana znaků je zde malé ka/ke kana (/) a vu kana . Řecká písmena :Umístěna v řádku 6. 24 malých a 24 velkých písmen řecké abecedy. Cyrilice :Umístěna v řádku 7. 33 malých a 33 velkých písmen ruské abecedy. Znaky pro textové rámečky :Jsou umístěny v řádku 8. Tenké čáry, tlusté čáry a kombinace tenkých a tlustých čar, celkem 32 znaků. Kandži :2965 znaků úrovně 1 od řádku 16 do řádku 47 a 3390 znaků úrovně 2 od řádku 48 do řádku 84, celkem 6355.

Odkazy

Reference

Související články

CP932 * Shift-JIS

Externí odkazy

[url=http://www. asahi-net. +moreor. jp/~AX2S-KMTN/ref/jisx0208. html]JIS kandži[/url] na Cyber Librarian - JIS kanji listing * [url=https://web. archive. org/web/20090430034054/http://www. webstore. jsa. or. jp/webstore/JIS/Search. jsp. lang=jp]Japanese Standards Association database search[/url] zde lze zakoupit poslední verzi normy * [url=http://www. aozora. gr. jp/hosetsu_kijyun/]Unification-related provisions in the JIS X 0208 and 0213 standards[/url].

Kategorie:Kódování asijských jazyků

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top