Punycode

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Punycode je v informatice název pro kódovací syntaxi, která umožňuje překlad řetězce znaků kódovaných prostřednictvím Unicode do jednoduché ASCII podoby, používané např. pro pojmenování síťových zařízení nebo internalizovaných internetových domén, jako jsou [url=https://háčkyčárky.cz]háčkyčárky.cz[/url], [url=https://lepší.tv]lepší.tv[/url], nebo [url=https://i❤️.ws]i❤️.ws[/url].

Kódovací princip

V této sekci je popsán postup Punycode kódování - ukazuje názorně převod řetězce „počítač“ do kódované podoby „pota-wpa5qd“.

Oddělení ASCII znaků

Nejprve jsou všechny základní (ASCII) znaky v řetězci odděleny od ostatních znaků (např. „počítač“ → „pota“). +more Pokud byl oddělen alespoň jeden ASCII znak přidá se na konec řetězce znak „-“ (např. „počítač“ → „pota-“).

Kódování ostatních znaků

Dále následuje kódování ostatních ne-ASCII znaků. Použitým algoritmem se kóduje nejen samotný znak, ale i jeho původní pozice v Unicode tvaru. +more Například řetězec „počítač“ je převeden do podoby „pota-wpa5qd“. Právě text za znakem „-“, tedy „wpa5qd“, v sobě nese zakódovanou informaci o ne-ASCII znacích (č, í a č) a jejich původním umístění v řetězci na 3. , 4. , resp. 7. místě zleva.

Pro použití v názvech domén IDN se ještě na začátek přidá konstantní „ACE prefix“ („xn--“). Zakódována doména např. +more „www. počítač. cz“ je tedy „www. xn--pota-wpa5qd. cz“.

Externí odkazy

[url=http://www.lupa.cz/clanky/jak-funguji-hacky-a-carky-v-domenach/]Jak fungují háčky a čárky v doménách?[/url]

Kategorie:Kódování znaků Kategorie:Domain Name System Kategorie:Transformační formáty Unicode

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top