Array ( [0] => 15533856 [id] => 15533856 [1] => cswiki [site] => cswiki [2] => UTF-16 [uri] => UTF-16 [3] => Unifont_Full_Map.png [img] => Unifont_Full_Map.png [4] => [day_avg] => [5] => [day_diff] => [6] => [day_last] => [7] => [day_prev_last] => [8] => [oai] => [9] => [is_good] => [10] => [object_type] => [11] => 1 [has_content] => 1 [12] => **UTF-16** UTF-16 je formát kódování znaků, který se široce používá pro reprezentaci písmen, číslic a symbolů ve mnoha jazycích světa. Tento formát je atraktivní díky své schopnosti efektivně kódovat nejen základní znaky latinky, ale i rozsáhlý soubor znaků pro různé jazyky a symboly, které lidé používají. Díky této flexibilitě je UTF-16 základem pro mezinárodní komunikaci a výměnu informací, čímž přispívá k propojení kultur a jazyků. UTF-16 kóduje znaky jako 16bitová čísla, což znamená, že dokáže snadno reprezentovat množství znaků, které by v mnoha jiných kódovačích vyžadovaly více místa. Kromě standardních znaků, jako jsou písmena a číslice, obsáhne také množství speciálních znaků a symbolů, což usnadňuje práci s textem v globálním měřítku. Jedním z hlavních důvodů, proč je UTF-16 populární, je jeho podpora pro různé platformy a technologie. Umožňuje programátorům vytvářet aplikace, které obstojí ve zkoušce mnohonárodnostního použití, čímž se zvyšuje jejich dosah a přístupnost pro uživatele po celém světě. Díky tomu přispívá k obchodním a kulturním výměnám a pomáhá lidem komunikovat způsobem, který je pohlcující a osobní. I když se UTF-16 může zdát složitější než některé alternativní kódování, jeho výhody v oblasti flexibility a podpory mezinárodních znaků jsou jasné. Je to důležitý nástroj, který umožňuje lidem sdílet své příběhy a myšlenky napříč jazykovými a kulturními hranicemi, což obohacuje naši společnou mozaiku lidského poznání. [oai_cs_optimisticky] => **UTF-16** UTF-16 je formát kódování znaků, který se široce používá pro reprezentaci písmen, číslic a symbolů ve mnoha jazycích světa. Tento formát je atraktivní díky své schopnosti efektivně kódovat nejen základní znaky latinky, ale i rozsáhlý soubor znaků pro různé jazyky a symboly, které lidé používají. Díky této flexibilitě je UTF-16 základem pro mezinárodní komunikaci a výměnu informací, čímž přispívá k propojení kultur a jazyků. UTF-16 kóduje znaky jako 16bitová čísla, což znamená, že dokáže snadno reprezentovat množství znaků, které by v mnoha jiných kódovačích vyžadovaly více místa. Kromě standardních znaků, jako jsou písmena a číslice, obsáhne také množství speciálních znaků a symbolů, což usnadňuje práci s textem v globálním měřítku. Jedním z hlavních důvodů, proč je UTF-16 populární, je jeho podpora pro různé platformy a technologie. Umožňuje programátorům vytvářet aplikace, které obstojí ve zkoušce mnohonárodnostního použití, čímž se zvyšuje jejich dosah a přístupnost pro uživatele po celém světě. Díky tomu přispívá k obchodním a kulturním výměnám a pomáhá lidem komunikovat způsobem, který je pohlcující a osobní. I když se UTF-16 může zdát složitější než některé alternativní kódování, jeho výhody v oblasti flexibility a podpory mezinárodních znaků jsou jasné. Je to důležitý nástroj, který umožňuje lidem sdílet své příběhy a myšlenky napříč jazykovými a kulturními hranicemi, což obohacuje naši společnou mozaiku lidského poznání. ) Array ( [0] => [[Soubor:Utf-16.svg|náhled|Ukázka UTF-16 kodování]] [1] => '''UTF-16''' ({{Vjazyce2|en|''16-bit Unicode Transformation Format''}}) je způsob [[kódování]] znaků [[ISO 10646]]/[[Unicode]] používající proměnnou délku kódu: pro kódování jednoho znaku se používají jedna nebo dvě [[16bitový|16bitové]] hodnoty. UTF-16 je rozšířením kódování staršího [[UCS-2]]; pro znaky v [[Basic Multilingual Plane|BMP]] (znaky v rozmezí U+0000–U+FFFF) se UTF-16 shoduje s UCS-2, tj. kóduje znaky přímo jako 16bitová čísla bez znaménka. Zatímco UCS-2 ostatní znaky (ty s kódy většími než [[Šestnáctková soustava|0x]]FFFF) kódovat neumožňuje vůbec, UTF-16 je kóduje pomocí dvojice šestnáctibitových hodnot (anglicky označované jako {{Cizojazyčně|en|''surrogate pair''}}) z intervalu 0xD800 až 0xDFFF. [2] => [3] => == Princip funkce == [4] => Znaky do U+FFFF jsou kódovány přímo jednou šestnáctibitovou hodnotou, znaky s vyššími kódy jsou reprezentovány pomocí dvou šestnáctibitových čísel tak, že první číslo je v rozmezí 0xD8000xDBFF a druhé číslo je v rozmezí 0xDC000xDFFF. Jelikož v rozmezí U+D800 až U+DFFF nedefinuje Unicode žádné platné znaky (tento rozsah je vyhrazen právě pro kódování ''{{cizojazyčně|en|surrogate pairs}}''), je takové kódování jednoznačné. Následující tabulka ukazuje způsob kódování (pozice bitů „xxx“ jsou vyplněny bity kódu znaku, vpravo jsou nejméně významné bity; ve druhém případě se od kódu znaku nejdříve odečte 0x010000): [5] => [6] => {| class="wikitable" [7] => | U+000000 – U+00FFFF [8] => | xxxxxxxxxxxxxxxx [9] => |- [10] => | U+010000 – U+10FFFF [11] => | 110110xxxxxxxxxx 110111xxxxxxxxxx [12] => |} [13] => [14] => Jelikož UTF-16 kóduje znaky do šestnáctibitových hodnot, je pro další zpracování zpravidla potřeba tyto šestnáctibitové hodnoty ještě převést do posloupnosti bajtů. Konkrétní způsob však závisí na používaném [[endianita|pořadí bajtů]]. Pro jednoznačnost se tedy někdy používají označení pro specifické schéma kódování: UTF-16LE (''little-endian'') a UTF-16BE (''big-endian''). Pokud se uvádí jen UTF-16, může na počátku být vložen [[Byte order mark|BOM]], kódování znaku U+FEFF, podle kterého příjemce rozpozná použité pořadí bajtů. Pokud není použité pořadí bajtů určeno explicitně, ani se nepoužije BOM, není kódování jednoznačné, zpravidla se chápe podle kontextu (typicky podle architektury příslušného počítače). [15] => [16] => === Příklad === [17] => Text „x∈𝕄“ je kódován takto: [18] => {| class="wikitable" [19] => ! Text [20] => | x || ∈ || 𝕄 [21] => |- [22] => ! Znaky Unicode [23] => | U+0078 || U+2208 || U+1D544 [24] => |- [25] => ! UTF-16 kódování [26] => | 0078 || 2208 || D835 DD44 [27] => |- [28] => ! Bajty v UTF-16LE [29] => | 78 00 || 08 22 || 35 D8 44 DD [30] => |} [31] => Výsledkem tedy je posloupnost šestnáctibitových hodnot 0078 2208 D835 DD44, resp. (při použití UTF-16LE) posloupnost bajtů 78 00 08 22 35 D8 44 DD. [32] => [33] => === Kódování === [34] => Dle [[rfc:2781|RFC 2781]] se kódují znaky definované normou ISO 10646 následovně: [35] => # Znaky s hodnotou menší než 0x010000 jsou zakódovány přímo jako 16bitové celé číslo. [36] => # U ostatních znaků (0x0100000x10FFFF) se od jejich hodnoty odečte 0x010000. Výsledkem je číslo v rozsahu 0x0000000x0FFFFF, které lze vyjádřit pomocí 20 bitů. [37] => # Horních 10 bitů předchozího výsledku vyplní spodní bity 16bitového čísla 0xD800 (původně v něm je spodních 11 bitů nulových, tedy volných), zatímco spodních 10 bitů výsledku se přičte k 16bitovému číslu 0xDC00 (spodních 10 bitů v něm je původně volných), čímž vznikne výsledný ''{{cizojazyčně|en|surrogate pair}}''). [38] => [39] => === Dekódování === [40] => Při dekódování jsou vstupní data čtena po 16 bitech a je prováděno následující rozhodování: [41] => # Pokud je hodnota menší než 0xD800 nebo větší než 0xDFFF, jedná se o konečný výsledek. [42] => # V opačném případě musí být hodnota v rozmezí 0xD8000xDBFF a je třeba přečíst dalších 16 bitů, které musí ležet v rozsahu od 0xDC00 do 0xDFFF (pokud některá z přečtených hodnot leží mimo příslušný rozsah, nejedná se o platné UTF-16). [43] => # Horních 10 bitů výsledku je utvořeno z dolních 10 bitů prvního čísla a dolních 10 bitů výsledku se vezme z druhého čísla, k výsledku se v tomto případě přičte ještě 0x010000 a jedná se o konečný výsledek. [44] => [45] => == Využití == [46] => UTF-16 se používá pro text v API v systémech [[Windows 2000|Microsoft Windows 2000]]/[[Windows XP|XP]]/[[Windows 2003|2003]]/[[Windows Vista|Vista]]/[[Windows 7|7]]/[[Windows 8|8]]/[[Windows CE|CE]].[http://msdn.microsoft.com/en-us/library/dd374081.aspx ''Unicode (Windows)'']. Retrieved 08 March 2011 "These functions use UTF-16 (wide character) encoding (…) used for native Unicode encoding on Windows operating systems." Starší systémy [[Windows NT]] (před Windows 2000) podporují pouze UCS-2.{{Citace elektronické monografie |titul = Description of storing UTF-8 data in SQL Server |vydavatel = microsoft.com |datum=2005-12-07 |url=http://support.microsoft.com/kb/232580 |datum přístupu = 2008-02-01 }} Ve [[Windows XP]] nejsou pro evropské jazyky žádné znaky s kódy přes U+FFFF.{{Citace elektronické monografie |titul = Unicode|vydavatel = microsoft.com |url=http://msdn.microsoft.com/en-us/library/dd374081(VS.85).aspx |datum přístupu = 2009-07-20 }}{{Citace elektronické monografie |titul = Surrogates and Supplementary Characters |vydavatel = microsoft.com |url=http://msdn.microsoft.com/en-us/library/dd374069(VS.85).aspx |datum přístupu = 2009-07-20 }} Obsah souborů a dat přenášených sítěmi bývá často směs kódování UTF-16, UTF-8 a starších [[kódová stránka|kódových stránek]]. [47] => [48] => [[IBM System i|iSeries]] systémy firmy [[IBM]] používají [[kódová stránka|kódovou stránku]] [[CCSID]] 13488 pro kódování UCS-2, CCSID 1200 pro kódování UTF-16 a CCSID 1208 pro kódování UTF-8.{{Citace elektronické monografie | url = http://publib.boulder.ibm.com/infocenter/iseries/v5r4/index.jsp?topic=%2Fdb2%2Frbafzmstccseta.htm |titul = Character conversion | vydavatel = [[IBM]] |datum přístupu = 2012-05-22}} [49] => [50] => UTF-16 používá operační systém [[Binary Runtime Environment for Wireless|Qualcomm BREW]], prostředí platformy [[.NET Framework|.NET]] i multiplatformní knihovna pro vytváření GUI [[Qt (knihovna)|Qt]]. [51] => [52] => [[Symbian OS]] použitý v telefonech Nokia S60 a Sony Ericsson [[UIQ]] používá UCS-2. Telefony [[iPhone]] používají pro [[SMS]] UTF-16 místo kódování UCS-2 popisovaného ve standardech [[GSM 03.38|3GPP TS 23.038]] a [[IS-637]].{{Citace elektronické monografie | titul=Adventures in Unicode SMS | vydavatel=Twilio | url=https://www.twilio.com/engineering/2012/11/08/adventures-in-unicode-sms | autor=Chad Selph | datum=2012-11-08 | datum přístupu=2015-08-28 | url archivu=https://web.archive.org/web/20150908104520/https://www.twilio.com/engineering/2012/11/08/adventures-in-unicode-sms | datum archivace=2015-09-08 | nedostupné=ano }} [53] => [54] => Systém souborů [[Joliet]] používaný pro dlouhá jména souborů na [[CD-ROM]] používá ve jménech souborů kódování UCS-2BE (max. délky 64 znaků). [55] => [56] => == Odkazy == [57] => [58] => === Reference === [59] => {{Překlad|en|UTF-16|678273675}} [60] => [61] => [62] => === Související články === [63] => * [[Unicode]] [64] => * [[ISO 10646]] [65] => * [[UTF-8]] [66] => * [[UTF-32]] [67] => [68] => === Externí odkazy === [69] => * {{Commonscat}} [70] => * [http://www.ietf.org/rfc/rfc2781.txt RFC 2781: ''UTF-16, an encoding of ISO 10646''] [71] => * [http://www.unicode.org/versions/latest/ch03.pdf#G7404 Kapitola ''3.9 Unicode Encoding Forms''] ve standardu Unicode [72] => {{Autoritní data}} [73] => [74] => [[Kategorie:Transformační formáty Unicode]] [] => )
good wiki

UTF-16

Ukázka UTF-16 kodování UTF-16 je způsob kódování znaků ISO 10646/Unicode používající proměnnou délku kódu: pro kódování jednoho znaku se používají jedna nebo dvě 16bitové hodnoty. UTF-16 je rozšířením kódování staršího UCS-2; pro znaky v BMP (znaky v rozmezí U+0000-U+FFFF) se UTF-16 shoduje s UCS-2, tj.

More about us

About

Tento formát je atraktivní díky své schopnosti efektivně kódovat nejen základní znaky latinky, ale i rozsáhlý soubor znaků pro různé jazyky a symboly, které lidé používají. Díky této flexibilitě je UTF-16 základem pro mezinárodní komunikaci a výměnu informací, čímž přispívá k propojení kultur a jazyků. UTF-16 kóduje znaky jako 16bitová čísla, což znamená, že dokáže snadno reprezentovat množství znaků, které by v mnoha jiných kódovačích vyžadovaly více místa. Kromě standardních znaků, jako jsou písmena a číslice, obsáhne také množství speciálních znaků a symbolů, což usnadňuje práci s textem v globálním měřítku. Jedním z hlavních důvodů, proč je UTF-16 populární, je jeho podpora pro různé platformy a technologie. Umožňuje programátorům vytvářet aplikace, které obstojí ve zkoušce mnohonárodnostního použití, čímž se zvyšuje jejich dosah a přístupnost pro uživatele po celém světě. Díky tomu přispívá k obchodním a kulturním výměnám a pomáhá lidem komunikovat způsobem, který je pohlcující a osobní. I když se UTF-16 může zdát složitější než některé alternativní kódování, jeho výhody v oblasti flexibility a podpory mezinárodních znaků jsou jasné. Je to důležitý nástroj, který umožňuje lidem sdílet své příběhy a myšlenky napříč jazykovými a kulturními hranicemi, což obohacuje naši společnou mozaiku lidského poznání.

Expert Team

Vivamus eget neque lacus. Pellentesque egauris ex.

Award winning agency

Lorem ipsum, dolor sit amet consectetur elitorceat .

10 Year Exp.

Pellen tesque eget, mauris lorem iupsum neque lacus.

You might be interested in

,'Windows XP','kódová stránka','ISO 10646','Unicode','UTF-32','CD-ROM','Windows NT','Windows 2000','Windows 2003','Windows 7','IS-637','Windows CE'