Autor Zpráva
toredor
Profil
Ahoj, mám problém s kódováním ruských stránek. Chtěl bych se zeptat jaké se tam používá kódování.

Děkuji za odpovědi
Rellik
Profil
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
Jaký je problém si zobrazit nějakou ruskou stránku a podívat se do kódu ;)
_es
Profil
toredor:
Nerieš jednu vec vo viacerých vláknach ( Azbuka a javascript).
toredor
Profil
Děkuji za odpověď. Ano ptám se na dvou vláknech. Tady jaké se používá kódování pro rusko protože ja standartně používám utf-8 pro všechno a nenašel jsem nikde slušnou odpověď co použít pro rusko. A na javascriptu se ptám proč se mi zobrazuje azbuka v javascriptu špatně a jinde ne.


Rellik:
Není to problém, ale našel jsem stránky s UTF-8, ale i windows-1251
Děkuji za vaši odpověď
Petr ZZZ
Profil
toredor:
Do utf-8 se vejde nějakých 60 tisíc znaků, azbuku určitě musí zvládat (zvládá i písma jako čínštinu atd.). Windows-1251 toho tuším umí o hodně míň (ale na ruštinu se běžně používá).
Chamurappi
Profil
Reaguji na Petra ZZZ:
Do utf-8 se vejde nějakých 60 tisíc znaků
Spíš přes milion.


Reaguji na toredora:
ja standartně používám utf-8 pro všechno
Proč by azbuka nemohla být součástí toho všeho?
Předpokládám, že pro ruštinu windows-1251 o něco málo vhodnější, než windows-1250 pro češtinu. V důsledku je to docela jedno. Můžeš mít stránku klidně v us-ascii

na javascriptu se ptám proč se mi zobrazuje azbuka v javascriptu špatně
Zobrazuje se ti špatně HTML, protože deklaruješ špatné kódování v HTTP hlavičce.
Petr ZZZ
Profil
Reaguji na Chamurappiho:
„Spíš přes milion.“

Jsi si jistý? Nějaký Stefan Haack tvrdí, že na této stránce má úplně všechny znaky z kódování UTF-8, končí tam ale číslem 65534. (Dvě na šestnáctou by bylo 65536.) (Už nevím, odkud těch něco přes šedesát tisíc mám, tohle jsem teď vygůglil. Nesouvisí to s tím, že UTF-8 používá na různé znaky různý počet bajtů?)
_es
Profil
Petr ZZZ:
Nějaký Stefan Haack tvrdí, že na této stránce má úplně všechny znaky z kódování UTF-8; končí tam ale číslem 65534.
Tak to budú všetky znaky len z BMP Unicode: cs.wikipedia.org/wiki/Unicode
Okrem toho UTF-8 je skôr spôsob kódovania znakovej sady, znaková sada je Unicode.
Petr ZZZ
Profil
Reaguji na _es:
„Okrem toho UTF-8 je skôr spôsob kódovania znakovej sady, znaková sada je Unicode.“
A to má nějaký dopad na otázku, kolik lze pomocí UTF-8 nakódovat znaků nebo zda je UTF-8 vhodné na zobrazení azbuky?
_es
Profil
Petr ZZZ:
Áno, lebo pomocou UTF-8 sa dá zapísať až 80000000(hex.) = 2 147 483 648 znakov, či pri obmedzení na maximálne 4 bajty 200000(hex.) = 2 097 152 znakov: cs.wikipedia.org/wiki/UTF-8#Zp.C5.AFsob_k.C3.B3dov.C3.A1n.C3.AD_znak.C5.AF
Niečo iné je, koľko znakov je definovaných v norme Unicode, či koľko znakov z toho je kde podporovaných - často to budú asi len znaky z BMP Unicode.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: