Autor Zpráva
Uroboros
Profil *
Mam otázečku, jaký je rozdíl mezi UTF-8, UTF-16, UTF-32, myslim že jsem dokonce někde viděl i UTF-64 a UTF-80.
Anonymní
Profil *
A ještě UTF-7
Anonymní
Profil *
Možná tady:
http://www.root.cz/diskuse/364
Anonymní
Profil *
http://en.wikipedia.org/wiki/UTF-7
llook
Profil
UTF-8 pro vyjádření znaku používá 1 až 4 byty, UTF-16 používá 2 až 4 byty. UTF-8 je zpětně kompatibilní se sedmibitovým us-ascii, tedy znaky z této tabulky (U+0 až U+7F) se v UTF-8 ukládají úplně stejně. UTF-16 je zas zpětně kompatibilní s UCS-2, což je kódování, kterým lze vyjádřit první půlku Unicode sady, což zatím bohatě stačí (třeba Java používá UCS-2 a zatím to snad každému stačilo), ale UTF-16 přidává možnost zapsat i zbytek znaků.

UTF-7 je divný kódování, který znaky vyjadřuje pouze byty s hodnotou do 0x7F, aby se to mohlo přenášet jakoby us-ascii a přitom vybraných 62 znaků (abeceda + interpunkce) se kóduje stejně jako v ascii.
UTF-32 je to samý co UCS-4, znak je reprezentován jediným čtyřbytovým integerem, odpovídajícím číslu v Unicode tabulce.

O UTF-64 ani UTF-80 jsem v životě neslyšel.
habendorf
Profil
llook: O UTF-64 ani UTF-80 jsem v životě neslyšel.

A slyšel jsi o UTF-16 LE a UTF-16 BE ? Ne že bych to potřeboval, ale je to v menu PSPadu, tak by mě to jen zajímalo.
llook
Profil
LE = little endian
BE = big endian

Je to o pořadí bytů. Jestli se jednička uloží jako 0x0001 nebo 0x0100.
habendorf
Profil
llook: Jj, pravda, že mě to nenapadlo. A celé se to řídí BOMem. http://www.sweb.cz/pichlik/archive/2003_08_24_archive.html
Díky.
Toto téma je uzamčeno. Odpověď nelze zaslat.

0