Punycode
Author
Albert FloresPunycode je v informatice název pro kódovací syntaxi, která umožňuje překlad řetězce znaků kódovaných prostřednictvím Unicode do jednoduché ASCII podoby, používané např. pro pojmenování síťových zařízení nebo internalizovaných internetových domén, jako jsou [url=https://háčkyčárky.cz]háčkyčárky.cz[/url], [url=https://lepší.tv]lepší.tv[/url], nebo [url=https://i❤️.ws]i❤️.ws[/url].
Kódovací princip
V této sekci je popsán postup Punycode kódování - ukazuje názorně převod řetězce „počítač“ do kódované podoby „pota-wpa5qd“.
Oddělení ASCII znaků
Nejprve jsou všechny základní (ASCII) znaky v řetězci odděleny od ostatních znaků (např. „počítač“ → „pota“). +more Pokud byl oddělen alespoň jeden ASCII znak přidá se na konec řetězce znak „-“ (např. „počítač“ → „pota-“).
Kódování ostatních znaků
Dále následuje kódování ostatních ne-ASCII znaků. Použitým algoritmem se kóduje nejen samotný znak, ale i jeho původní pozice v Unicode tvaru. +more Například řetězec „počítač“ je převeden do podoby „pota-wpa5qd“. Právě text za znakem „-“, tedy „wpa5qd“, v sobě nese zakódovanou informaci o ne-ASCII znacích (č, í a č) a jejich původním umístění v řetězci na 3. , 4. , resp. 7. místě zleva.
Pro použití v názvech domén IDN se ještě na začátek přidá konstantní „ACE prefix“ („xn--“). Zakódována doména např. +more „www. počítač. cz“ je tedy „www. xn--pota-wpa5qd. cz“.
Související články
Externí odkazy
[url=http://www.lupa.cz/clanky/jak-funguji-hacky-a-carky-v-domenach/]Jak fungují háčky a čárky v doménách?[/url]
Kategorie:Kódování znaků Kategorie:Domain Name System Kategorie:Transformační formáty Unicode