Autor Zpráva
gin
Profil *
Dobrý den, dělám si stránky v 1250, ale tíží mě otázka jestli neni lepší kodovat v UTF-8? Přeci jenom jsou vyhledávače kodované v UTF-8. Chci se zeptat jestli robutek zná 1250? Pokud jo, tak neni asi co řešit. Děkuju za odpověď

Moderátor Joker: Titulek „V jakém jazyce je lepší kodovat?“ byl matoucí, změnil jsem ho.
Radek9
Profil
gin:
Pletete hrozně pojmů do hromady a navíc ještě blbě.
1) Nejsou to jazyky, ale kódování.
2) Není to 1250, ale windows-1250 (popřípadě cp1250).
3) O kódování vyhledáváčů moc nevím, ale problém to není, jelikož je plno stránek psaných ve windows-1250, ISO a v mnohých jiných kódováních.
gin
Profil *
Příště budu psát kodovací jazyk :-) Máte pravdu, že jsem to měl víc upřesnit. Byla to blbá tázka, ale chtěl jsem znát víc pohledů na kodovaní stránek ve windows-1250. Děkuju za odpověď
panther
Profil
gin:
na kódování stránky nezáleží, je-li dobře nastaveno a znaky se zobrazují tak, jak mají.
Chamurappi
Profil
Reaguji na gina:
Přeci jenom jsou vyhledávače kodované v UTF-8.
Co to znamená? To jako, že jejich weby jsou kódované v UTF-8?
Když přijdu na Google s Internet Explorerem 3, který nezná UTF-8, uvidím vše v pořádku.

Chci se zeptat jestli robutek zná 1250?
Zkoušel sis vyhledat nějakou stránku, která užívá windows-1250? Třeba Lidovky jedou v tomto kódování — myslíš, že vyhledávače neporozumí tamním textům? Proč by robot vyhledávače neměl zvládat technický detail, který prohlížeče hravě zvládají?
Miloš
Profil
gin:
Příště budu psát kodovací jazyk
a bude to opět špatně ;-)
Z hlediska vyhledavačů je naprosto lhostejné, jaké vhodné(*) kódování použiješ, pokud ho použiješ správně.
Připomíná mi to otázku, jakou ruku mám použít při… (**)

(*) windows-1250, iso-8859-2, utf-8
(**) např. mytí hlavy
petrox
Profil
Doporučil bych UTF-8, ale obecně je to asi celkem jedno.
Pro česky psané stránky je vhodné použít třeba i iso-8859-2 nebo utf-16 a již zmíněné windows-1250.
Možná stojí za zmínku, že třeba Seznam.cz nepodporuje západoevropské ISO-8859-1 nebo latin2 (cp852).

Obzvláště na ISO-8859-1 pozor. Spousta CMS systémů je na toto kódování nastavena v defaultu.

OT: abyste se ujistil, že deklarované kódování je skutečně to, které je použito zkuste nechat zobrazit na stránce znaky žšř. Co je uvedeno v meta charset ještě nemusí být nutně skutečným kódováním souboru a tyto znaky jsou typicky "nejproblémovější".
Bubák
Profil
petrox:
nebo utf-16
To není moc úsporné.
Chamurappi
Profil
Reaguji na petroxe:
třeba Seznam.cz nepodporuje západoevropské ISO-8859-1
Vážně? Jak se nepodpora projevuje? Prosím o nějakou ukázku.

nebo latin2 (cp852)
Latin 2 je ISO-8859-2.
petrox
Profil
Bubák:
To není moc úsporné.
Záleží, jaké texty na webu budou. Byl to jen příklad.
Joker
Profil
petrox:
Záleží, jaké texty na webu budou. Byl to jen příklad.
Pro česky psané stránky bude UTF-8 vždycky úspornější než UTF-16, takže nesouhlasím s výrokem Pro česky psané stránky je vhodné použít utf-16 (stejně jako nesouhlasím s „Seznam.cz nepodporuje západoevropské ISO-8859-1 nebo latin2 (cp852)“)

K tématu vlákna, moje doporučení je stále stejné:
- Je závažný důvod pro použití konkrétního kódování (například upravuji něco už existujícího, kde už se nějaké kódování používá)?
-> ANO: použít to dané kódování
-> NE: použít UTF-8
petrox
Profil
Chamurappi:
Vážně? Jak se nepodpora projevuje? Prosím o nějakou ukázku.

Nepodpora by se měla projevit nezařazením do indexu vyhledávání viz nápověda fulltextu.
Netvrdím, že se stránka v ISO-8859-1 do hledání dostat nemůže. Ale pochybuju, že zpracování proběhne úplně korektně (robot zkusí odhadnout kódování a to nemusí dopadnout moc dobře).

Latin 2 je ISO-8859-2.
Trochu jsem to zmotal. Ano, pro ISO-8859-2 se používá označení ISO Latin 2. Já myslel IBM Latin 2.
Zkrátka. Pokud se chcete vyhnout možným problémům při zpracování Seznambotem, pak je dobré se držet osvědčených znakových sad UTF-8, ISO-8859-2 a Windows-1250.
petrox
Profil
Joker:
Pro česky psané stránky bude UTF-8 vždycky úspornější než UTF-16, takže nesouhlasím s výrokem Pro česky psané stránky je vhodné použít utf-16

Jasně, argument úspory beru. Prostě jsem jen chtěl říct, že UTF-16 Seznambot podporuje. A pokud by toto kódování bylo potřeba z nějakého důvodu použít pro české stránky, které má indexovat Seznam, tak ta možnost tu je.

(stejně jako nesouhlasím s ‚Seznam.cz nepodporuje západoevropské ISO-8859-1 nebo latin2 (cp852)‘)

Přít se nechci;) Jen jsem kouknul do nápovědy a tam stojí černé na červeném:
Stránky s jiným než výše uvedeným kódováním se do indexu nedostanou.
Chamurappi
Profil
Reaguji na petroxe:
V dnešní době není problém, aby jakýkoliv robot podporoval jakékoliv kódování (stejně jako jakýkoliv prohlížeč). Pokud Seznam úmyslně týrá stránky s cizojazyčnou znakovou sadou, činí tak spíš proto, že chce mít v indexu především česky psané stránky, nikoliv z technických důvodů. Ale stejně bych rád viděl ukázku problému, té nápovědě příliš nevěřím. Stránka totiž může vypadat česky nezávisle na tom, jaké kódování užívá.

Ano, pro ISO-8859-2 se používá označení ISO Latin 2. Já myslel IBM Latin 2.
Aha, ona je ta přezdívka nejednoznačná, netušil jsem.
petrox
Profil
Chamurappi:
činí tak spíš proto, že chce mít v indexu především česky psané stránky, nikoliv z technických důvodů

V podstatě ano. Dá se říct, že je to jeden z nejsnazších filtrů. Pokud totiž znaková sada nepodporuje š a ž, tak v ní nikdo asi vědomě a cíleně nebude psát české texty.

Ale stejně bych rád viděl ukázku problému, té nápovědě příliš nevěřím.

Příklad, kdy by byla stránka česky a přitom měla deklarované třeba iso-8859-1 jsem žádný nenašel (moc jsem nehledal).
Nápověda by měla být aktuální. nedávno prošla aktualizací.

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: