Autor Zpráva
loyza
Profil
V poslední době stále všude vidím doporučení používat kódování utf-8 Zajímalo by mě proč je zrovna tohle kódování tak protěžováno. Přijde mi, že je stejně jako windows-1250 i iso-8859-2 osmibitové, tak proč používat zorvna utf ?? Je v něčem lepší??
Peca
Profil
Zas tak úplně osmibitové není. Podívej se na znaky s diakritikou. Výhoda je v tom, že je univerzální, použitelné pro všechny jazyky.
quinux
Profil
loyza
UTF-8 obsahuje znakové sady všech jazyků a podporuje jej dnes už téměř každá aplikace.

Př.: Když poletíš na dovolenou na Seychelly a půjdeš do tamní internetové kavárny, tak prohlížeč tam nainstalovaný bude umět UTF-8, ale nemusí mít doinstalovanou podporu pro iso-8859-2 či windows-1250 ;o)
souki
Profil
utf-8 je univerzální... a proto je lepší. tečka
Miloš
Profil
Pomocí UTF-8 lze můžeš zapisovat přímo spoustu znaků, které bys jinak musel opisovat pomocí entit.
loyza
Profil
Jak úplně osmibitové není?? Já myslel, že utf-8 je osmibitové a utf-16 je šestnáctibitové a tak dál. No a jestliže je osmibitové tak obsahuje dvěstapadesátšest znaků a to se tam podle mě nemůžou vejít znaky ze všech jazyků. Co to znamená, že je univerzální?? Mě to teda zas taková spousta znaků nepřijde.
loyza
Profil
Divný se mi to začalo zdát v tu chvíli, když jsem v databázi našel, že existují kódování
utf-8_czech_ci
utf-8_polish_ci
a spousta a spousta dalších, tak kde je ta univerzálnost??
Bubák
Profil
Jeden z mnoha článků:
http://www.ics.muni.cz/zpravodaj/articles/133.html - Standard Unicode - cesta z chaosu kódování znaků

utf-8 je univerzální... a proto je lepší. tečka
Přesně tyhle "vysvětlení" nemám rád.
Miloš
Profil
UTF-8 používá 1 Byte (8 bitů) pro ASCII 7, dva Byty (16 bitů) pro ostatní znaky.
souki
Profil
loyza
ale to určuje pouze způsob abecedního řazení... to se v různých jazycích liší

Bubák
co jsme tím myslel pochopíš až budeš muset do starého webu přidat podporu ruské jazykové verze a do to přemlouvat třeba ještě XML... ano jde to, ale s utf, které je UNIVERZÁLNÍ se některé problémy prostě řešit nemusí
Peca
Profil
utf-8_czech_ci
utf-8_polish_ci

Jedná se o kódování utf-8, ale různé porovnávání.
DoubleThink
Profil *
No a jestliže je osmibitové tak obsahuje dvěstapadesátšest znaků
Nikoliv.
Ta osmička udává počet bitů na jednu posloupnost. Těch může být v UTF8 až 6, takže to máš nějakých slabých 3*10^14 znaků, což bohatě stačí pro všechny jazyky na planetě.

Výhoda UTF8 (oproti UTF16 a 32) je, že se v prvním bytu kryje s ASCII Extended. Takže (narozdíl od ostatních Unicode norem) je zpětně kompatibilní.
loyza
Profil
Jaj už to chápu. Díky za vysvětlení, hlavně díky Bubákovi za ten odkaz. Já si totiž původně myslel, že utf-8 je vždy osmibitové, ale ono není.
loyza
Profil
Ještě mi není jasné na co existují UTF-16 a UTF-32 když nejsou zpětně kompatibilní a pro všechny jazyky současné a historické a veškeré další nám stačí UTF-8, ale bez této znalosti se dá krásně žít.
souki
Profil
loyza
UTF-8 je pro většinu světových jazyků... nevím jak je na tom třeba taková "zjednodušená) čínština...
Chamurappi
Profil
Doplním quinuxe:
Když poletíš na dovolenou na Seychelly a půjdeš do tamní internetové kavárny, tak prohlížeč tam nainstalovaný bude umět UTF-8, ale nemusí mít doinstalovanou podporu pro iso-8859-2 či windows-1250 ;o)
... což v některých labilních značkovacích jazycích povede k jisté smrti dokumentu. V XML formátech jsou UTF kódování jedinou možností, jak zajistit alespoň základní funkčnost dokumentu po celém světě (i když potřebné fonty mohou stále chybět).

Jinak jsem si nevšiml, že by bylo nějak zvlášť protežováno.
DoubleThink
Profil *
protežováno

S háčkem je to taky správně
Chamurappi
Profil
Reaguji na DoubleThinka:
Syntakticky ano, ale znamená to něco jiného. Viz ÚJČ AV ČR FAQ.
habendorf
Profil
OT: Protěžovat je od slova těžit, protežovat od slova protekce. Nicméně 99,99% populace používá slovo protěžovat nesprávně ve smyslu protežovat.
Miloš
Profil
habendorf
Nicméně 99,99% populace používá slovo protěžovat nesprávně ve smyslu protežovat.
Nevím, kde bereš statistickou jistotu, ale souhlasím s tím, že řada lidí mně štve protěžováním jejích standartů, aby jsem mněl ra…DOST!
DoubleThink
Profil *
Nicméně 99,99% populace používá slovo protěžovat nesprávně ve smyslu protežovat
Vida - tak to zřejmě patřím mezi majoritu populace.
Toto téma je uzamčeno. Odpověď nelze zaslat.

0