Windows-1252

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Kódování Windows-1252, někdy nesprávně nazývané „ANSI“ nebo „ASCII“. Znaky zobrazené červeně jsou v ISO-8859-1 použity pro řídicí znaky ze sady C1. Modré tečky indikují nepoužité nebo řídicí znaky Windows-1252 nebo CP-1252 je znaková sada používaná implicitně ve starších verzích Microsoft Windows pro angličtinu a některé další západoevropské jazyky. Patří mezi kódové stránky systému Windows.

Detaily

Zatímco kódování IANA ISO-8859-1 obsazuje kódy 0x80 až 0x9F řídicími znaky z řídicí sady C1, Windows-1252 používá tyto kódy pro tisknutelné znaky. Z pohledu tisknutelných znaků a díky minimálnímu používání řídicích znaků ze sady C1 bývá Windows-1252 považováno za nadmnožinu kódování ISO 8859-1. +more Z přidaných znaků jsou významné jednoduché a dvojité uvozovky, znak Euro a všechny tisknutelné znaky, které jsou (s jinými kódy) v ISO 8859-15. V Microsoft Windows se označuje jako kódová stránka číslo 1252, IANA používá označení „windows-1252“.

Velmi často je kódování Windows-1252 označováno jako ISO-8859-1. Obvyklým důsledkem bylo, že všechny uvozovky a apostrofy (vytvořené ve slovních procesorech funkcí „smart quotes“) byly na jiných operačních systémech než Windows nahrazeny otazníky nebo čtverečky, což ztěžovalo čtení textu. +more Většina moderních WWW prohlížečů a klientů pro e-mail zobrazuje MIME charset=ISO-8859-1 jako Windows-1252, aby zobrazovaly takto chybně označené texty správně. Okolo roku 2010 to bylo standardní chování v HTML 5, které vyžadovalo, aby dokumenty označené jako ISO-8859-1 byly skutečně analyzovány s kódováním Windows-1252. V dubnu 2017 uvádělo kódování Windows-1252 0,8 % WWW stránek, ale 5,2 % stránek používalo ISO-8859-1, které by podle norem HTML5 měly být považovány za stejné kódování, takže lze říct, že efektivně 6 % WWW stránek používá kódování Windows-1252.

Označení „ANSI Code Page“ (ACP) se historicky používalo ve Windows pro označení různých kódových stránek považovaných za nativní. Původním úmyslem bylo zaregistrovat většinu kódových stránek jako ANSI standard podobně jako ISO/IEC 8859-1. +more Ale ani první a zdaleka nejpoužívanější takto pojmenovaná kódová stránka, kterou je právě Windows-1252, nebyla nikdy ANSI standardem. Microsoft píše: „Používání termínu ANSI pro označení kódových stránek Windows je překonané, nyní nevhodné, ale v komunitě uživatelů Windows přetrvává. “.

V systému LaTeX je kódování CP-1252 označovano jako „ansinew“.

Struktura kódové stránky

Následující tabulka zobrazuje kódování Windows-1252. U každého znaku je uveden jeho kódový bod Unicode a desítkový kód. +more Konverze do Unicode vycházejí z mapování Windows-1252 s „best fit“ uvedeného na serveru Unicode. org.

{{chset-cell3|002D|[[Spojovník|-
{{chset-cell3|007B|{|123}}{{chset-cell3|007D|[[Závorky
]]|125}} || || |- . |style="border: green 2px solid; background:#DFDFE7;"| || |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#FFEFDF;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#FFEFDF;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#FFEFDF;"| || |style="border: green 2px solid; background:#FFEFDF;"| || |- . +more || |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#FFEFDF;"| |style="border: green 2px solid; background:#DFDFE7;"| |style="border: green 2px solid; background:#FFEFDF;"| || |style="border: green 2px solid; background:#FFEFDF;"| |style="border: green 2px solid; background:#FFEFDF;"| |- . || || || || || || || || || || || || || || || || |- . || || || || || || || || || || || || || || || || |- . || || || || || || || || || || || || || || || || |- . || || || || || || || || || || || || || || || || |- . || || || || || || || || || || || || || || || || |- . || || || || || || || || || || || || || || || ||.

|}

Podle informací z webů firmy Microsoft a Unicode Consortia nejsou kódy 0x81, 0x8D, 0x8F, 0x90 a 0x9D použité; Windows API [url=http://msdn. microsoft. +morecom/en-us/library/windows/desktop/dd319072%28v=vs. 85%29. aspx]MultiByteToWideChar[/url] je však převádí na odpovídající znaky z řídicí sady C1. Toto chování je zdokumentováno i v „best fit“ mapování.

Historie

V první verzi kódové stránky 1252 používané v Microsoft Windows 1. 0 nebyly definované pozice 0xD7 a 0xF7 a celý rozsah 0x80-0x9F. +more * Ve druhé verzi používané v Microsoft Windows 2. 0 byly nově definované kódy 0x91, 0x92, 0xD7 a 0xF7. * Třetí verze používaná od Microsoft Windows 3. 1, měla definované všechny pozice kromě znaku Eura a dvojice znaků Z s háčkem. * Poslední verze, která je popsána výše, se objevila v Microsoft Windows 98 a v rámci updatu doplňujícího znak Eura byla portována i na starší verze Windows.

Odkazy

Reference

Související články

Kódování znaků pro západoevropské jazyky * Windows-1250

Externí odkazy

[url=https://msdn. microsoft. +morecom/en-us/library/cc195054. aspx]Referenční tabulka kódování Windows 1252[/url] * [url=http://www. iana. org/assignments/charset-reg/windows-1252]IANA registrace jména znakové sady[/url] * [url=http://www. unicode. org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1252. TXT]Tabulka mapování Windows 1252 na Unicode[/url].

Kategorie:Kódování znaků Kategorie:Kódové stránky v systému Windows

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top