Autor | Zpráva | ||
---|---|---|---|
gin Profil * |
Dobrý den, dělám si stránky v 1250, ale tíží mě otázka jestli neni lepší kodovat v UTF-8? Přeci jenom jsou vyhledávače kodované v UTF-8. Chci se zeptat jestli robutek zná 1250? Pokud jo, tak neni asi co řešit. Děkuju za odpověď
Moderátor Joker: Titulek „V jakém jazyce je lepší kodovat?“ byl matoucí, změnil jsem ho.
|
||
Radek9 Profil |
#2 · Zasláno: 7. 5. 2010, 13:14:47
gin:
Pletete hrozně pojmů do hromady a navíc ještě blbě. 1) Nejsou to jazyky, ale kódování. 2) Není to 1250, ale windows-1250 (popřípadě cp1250). 3) O kódování vyhledáváčů moc nevím, ale problém to není, jelikož je plno stránek psaných ve windows-1250, ISO a v mnohých jiných kódováních. |
||
gin Profil * |
#3 · Zasláno: 7. 5. 2010, 13:19:01
Příště budu psát kodovací jazyk :-) Máte pravdu, že jsem to měl víc upřesnit. Byla to blbá tázka, ale chtěl jsem znát víc pohledů na kodovaní stránek ve windows-1250. Děkuju za odpověď
|
||
panther Profil |
#4 · Zasláno: 7. 5. 2010, 13:22:21
gin:
na kódování stránky nezáleží, je-li dobře nastaveno a znaky se zobrazují tak, jak mají. |
||
Chamurappi Profil |
#5 · Zasláno: 7. 5. 2010, 13:25:55
Reaguji na gina:
„Přeci jenom jsou vyhledávače kodované v UTF-8.“ Co to znamená? To jako, že jejich weby jsou kódované v UTF-8? Když přijdu na Google s Internet Explorerem 3, který nezná UTF-8, uvidím vše v pořádku. „Chci se zeptat jestli robutek zná 1250?“ Zkoušel sis vyhledat nějakou stránku, která užívá windows-1250 ? Třeba Lidovky jedou v tomto kódování — myslíš, že vyhledávače neporozumí tamním textům? Proč by robot vyhledávače neměl zvládat technický detail, který prohlížeče hravě zvládají?
|
||
Miloš Profil |
#6 · Zasláno: 7. 5. 2010, 13:38:06 · Upravil/a: Miloš
gin:
„Příště budu psát kodovací jazyk“ a bude to opět špatně ;-) Z hlediska vyhledavačů je naprosto lhostejné, jaké vhodné(*) kódování použiješ, pokud ho použiješ správně. Připomíná mi to otázku, jakou ruku mám použít při… (**) (*) windows-1250, iso-8859-2, utf-8 (**) např. mytí hlavy |
||
Časová prodleva: 3 dny
|
|||
petrox Profil |
#7 · Zasláno: 10. 5. 2010, 09:50:15
Doporučil bych UTF-8, ale obecně je to asi celkem jedno.
Pro česky psané stránky je vhodné použít třeba i iso-8859-2 nebo utf-16 a již zmíněné windows-1250. Možná stojí za zmínku, že třeba Seznam.cz nepodporuje západoevropské ISO-8859-1 nebo latin2 (cp852). Obzvláště na ISO-8859-1 pozor. Spousta CMS systémů je na toto kódování nastavena v defaultu. OT: abyste se ujistil, že deklarované kódování je skutečně to, které je použito zkuste nechat zobrazit na stránce znaky žšř. Co je uvedeno v meta charset ještě nemusí být nutně skutečným kódováním souboru a tyto znaky jsou typicky "nejproblémovější". |
||
Bubák Profil |
#8 · Zasláno: 10. 5. 2010, 10:06:11
petrox:
„nebo utf-16“ To není moc úsporné. |
||
Chamurappi Profil |
#9 · Zasláno: 10. 5. 2010, 10:41:22
Reaguji na petroxe:
„třeba Seznam.cz nepodporuje západoevropské ISO-8859-1“ Vážně? Jak se nepodpora projevuje? Prosím o nějakou ukázku. „nebo latin2 (cp852)“ Latin 2 je ISO-8859-2. |
||
petrox Profil |
#10 · Zasláno: 10. 5. 2010, 10:59:33
Bubák:
To není moc úsporné. Záleží, jaké texty na webu budou. Byl to jen příklad. |
||
Joker Profil |
#11 · Zasláno: 10. 5. 2010, 11:26:14 · Upravil/a: Joker
petrox:
„Záleží, jaké texty na webu budou. Byl to jen příklad.“ Pro česky psané stránky bude UTF-8 vždycky úspornější než UTF-16, takže nesouhlasím s výrokem Pro česky psané stránky je vhodné použít utf-16 (stejně jako nesouhlasím s „Seznam.cz nepodporuje západoevropské ISO-8859-1 nebo latin2 (cp852)“) K tématu vlákna, moje doporučení je stále stejné: - Je závažný důvod pro použití konkrétního kódování (například upravuji něco už existujícího, kde už se nějaké kódování používá)? -> ANO: použít to dané kódování -> NE: použít UTF-8 |
||
petrox Profil |
#12 · Zasláno: 10. 5. 2010, 11:32:02
Chamurappi:
Vážně? Jak se nepodpora projevuje? Prosím o nějakou ukázku. Nepodpora by se měla projevit nezařazením do indexu vyhledávání viz nápověda fulltextu. Netvrdím, že se stránka v ISO-8859-1 do hledání dostat nemůže. Ale pochybuju, že zpracování proběhne úplně korektně (robot zkusí odhadnout kódování a to nemusí dopadnout moc dobře). Latin 2 je ISO-8859-2. Trochu jsem to zmotal. Ano, pro ISO-8859-2 se používá označení ISO Latin 2. Já myslel IBM Latin 2. Zkrátka. Pokud se chcete vyhnout možným problémům při zpracování Seznambotem, pak je dobré se držet osvědčených znakových sad UTF-8, ISO-8859-2 a Windows-1250. |
||
petrox Profil |
#13 · Zasláno: 10. 5. 2010, 11:49:45
Joker:
„Pro česky psané stránky bude UTF-8 vždycky úspornější než UTF-16, takže nesouhlasím s výrokem Pro česky psané stránky je vhodné použít utf-16“ Jasně, argument úspory beru. Prostě jsem jen chtěl říct, že UTF-16 Seznambot podporuje. A pokud by toto kódování bylo potřeba z nějakého důvodu použít pro české stránky, které má indexovat Seznam, tak ta možnost tu je. „(stejně jako nesouhlasím s ‚Seznam.cz nepodporuje západoevropské ISO-8859-1 nebo latin2 (cp852)‘)“ Přít se nechci;) Jen jsem kouknul do nápovědy a tam stojí černé na červeném: Stránky s jiným než výše uvedeným kódováním se do indexu nedostanou. |
||
Chamurappi Profil |
#14 · Zasláno: 10. 5. 2010, 12:31:31
Reaguji na petroxe:
V dnešní době není problém, aby jakýkoliv robot podporoval jakékoliv kódování (stejně jako jakýkoliv prohlížeč). Pokud Seznam úmyslně týrá stránky s cizojazyčnou znakovou sadou, činí tak spíš proto, že chce mít v indexu především česky psané stránky, nikoliv z technických důvodů. Ale stejně bych rád viděl ukázku problému, té nápovědě příliš nevěřím. Stránka totiž může vypadat česky nezávisle na tom, jaké kódování užívá. „Ano, pro ISO-8859-2 se používá označení ISO Latin 2. Já myslel IBM Latin 2.“ Aha, ona je ta přezdívka nejednoznačná, netušil jsem. |
||
petrox Profil |
#15 · Zasláno: 10. 5. 2010, 13:23:26
Chamurappi:
„činí tak spíš proto, že chce mít v indexu především česky psané stránky, nikoliv z technických důvodů“ V podstatě ano. Dá se říct, že je to jeden z nejsnazších filtrů. Pokud totiž znaková sada nepodporuje š a ž, tak v ní nikdo asi vědomě a cíleně nebude psát české texty. „Ale stejně bych rád viděl ukázku problému, té nápovědě příliš nevěřím.“ Příklad, kdy by byla stránka česky a přitom měla deklarované třeba iso-8859-1 jsem žádný nenašel (moc jsem nehledal). Nápověda by měla být aktuální. nedávno prošla aktualizací. |
||
Časová prodleva: 14 let
|
0