Autor Zpráva
Petr ZZZ
Profil
Přeji hezký večer. Mám rád dlouhou pomlčku – a zajímalo by mě, zda je pro účely SEO jedno, jestli napíšu listo-pad nebo listo–pad. Pochopí vyhledávač v obou případech, že jsou zde míněna dvě slova – "listo" a "pad"? Bere třeba Google dlouhou pomlčku stejně jako krátkou?

A jak je to s podtržítkem? O tom _ jsem četl, že může dělat neplechu v tom smyslu, že je chápáno jako část jediného slova a v názvu domény – třeba velky_pes – se proto podtržítko nedoporučuje. Platí to ještě nebo se na tom něco změnilo? Předem děkuji.
Tomáš Meisner
Profil
[#1] Petr ZZZ

A je vůbec "dlouhá pomlčka" povolena pro URL?
Chamurappi
Profil
Reaguji na Petra ZZZ:
zajímalo by mě, zda je pro účely SEO jedno, jestli napíšu listo-pad nebo listo–pad
Myslím si, že je. Můžeme si to snadno vyzkoušet: křupavý–bernardýn. Za pár minut bude tento text zaindexován a vlákno patrně bude dohledatelné na obě slova.

v názvu domény – třeba velky_pes – se proto podtržítko nedoporučuje
V české doméně druhého řádu ani být nemůže, pokud vím.


Reaguji na Tomáše Meisnera:
Petr ZZZ se zřejmě neptá na URL.
Odkázané RFC už je oficiálně zastaralé a nahrazené novějším, které ovšem také neodpovídá realitě. Do adresy jde celkem beztrestně protlačit téměř cokoliv. Vývoj směřuje k tomu, že se na webu přestane standardní URI používat.
Petr ZZZ
Profil
Díky Tomáši Meisnerovi i Chamurappimu za odpovědi! Zase jsem o kousek dál, i když jsem se nešikovně vyjádřil. Doménu jsem zmínil, protože napsat do obyčejného textu velky_pes by byla blbost a v doméně (kterou jsem si spletl s URL :-) ani jinde v URL, pokud vím, by neměly být mezery. Samozřejmě mě zajímá oboje – jak je to v obyčejném texu i jak je to v doméně. Mimochodem jsem měl v mozku uzel: Na jedné straně melu o doméně (do které jsem jaksi zahrnul i název html-souboru) a zároveň mě nenapadne to vyzkoušet – přitom mám na vlastním webu podtržítko v názvu dobré stovky stránek (z doby, kdy jsem nejen o SEO nevěděl ani to málo, co vím dnes). Takže podtržítko by bylo alespoň pokud jde o Google jasné – dělí podle něho slova (přinejmenším v URL): Carabus Zabra

Ta dlouhá pomlčka zatím nevím, asi vyzkoušet, jak navrhl Chamurappi. Budu křupavého bernardýna sledovat. :-) Ještě jednou dík!
Chamurappi
Profil
Reaguji na Petra ZZZ:
Budu křupavého bernardýna sledovat.
Na to pozor — jakmile jsou na této stránce i jednotlivá slova bez pomlčky, neprokáže test nic. (Velké vyhledávače umějí skloňovat.)

Edit: Dobře, tak bernardýn už je na test nepoužitelný, vystřídá ho plešatá–veverka.
Marek Prokop
Profil
Petr ZZZ:
Takže podtržítko by bylo alespoň pokud jde o Google jasné

Mně to jasné není. Myslím, že jste použil nevhodný dotaz, který nic nedokazuje. Google sice už víc než před rokem oznámil, že bude chápat podtržítko jako oddělovač slov, ale pokud vím, skutek zatím utek. Klasický test na tohle je:

http://www.google.com/search?hl=en&q=allinurl:mod_rewrite

vs.

http://www.google.com/search?hl=en&q=allinurl:mod%20rewrite

Křupavého bernardýna sledujte, ale nezapomeňte ho sledovat ve všech vyhledavačích každý den. Jinak to totiž bude opět nespolehlivé. Viz též Detailní algoritmy vyhledavačů mne moc nezajímají.

V praxi bych se snažil být opatrný a nedával bych mezi dvě slova, na kterých hodně záleží, žádné neobvyklé oddělovací znaky. Typografie je v HTML stejně natolik nedokonalá, že už to různě dlouhé pomlčky nevytrhnou.
Petr ZZZ
Profil
Chamurappi:
Omlouvám se za znehodnocení příkladu s pejskem a děkuji za toho druhého obratlovce. Pro jistotu přidám ještě zabrblanost–krumpudla bez diakritiky.

Marek Prokop:
Ten příklad s podtržítkem snad by měl být oukej. Já aspoň vidím URL ve vyhledávači tak, že hledané slovo je dvakrát zvýrazněné – z toho soudím, že to bere jako slovo i v případě zápisu slovo_00000005.

Opatrnost je vždycky dobrá deviza, ale někdy je nutno rozhodnout jinak, než by opatrnému postupu odpovídalo. V konkrétním případě mi nejde jen o vyhledávače, ale zároveň i o to, aby si uživatel ta Tři–Důležitá–Slova snadno zapamatoval. Protože s dlouhou pomlčkou padnou líp do oka, chci je oddělit tak a ne obyčejnou krátkou pomlčkou, i za cenu toho, že je to myslím typograficky nesprávné (pokud vím, nemá dlouhá pomlčka uprostřed slova co pohledávat). Možná se ptáte, proč Tři Důležitá Slova vůbec psát dohromady s pomlčkou, ale jde mi o web v němčině, ve které se to složenými slovy jen hemží, a zkrátka jde o složené slovo, které by šlo pomocí pomlček rozsekat na jednotlivé části a těmi pak nakrmit Broka–Gůgla. Něco jako

Donaudampfschifffahrtskapitaen versus
Donau-Dampf-Schiff-Fahrts-Kapitaen versus
Donau–Dampf–Schiff–Fahrts–Kapitaen.

Dodatek (15:22): Přidávám ještě posklapitka_hrontoucko a máme to i s tím zatrápeným podtržítkem :-)
Marek Prokop
Profil
Ten příklad s podtržítkem snad by měl být oukej.

Ten můj je, ten Váš není :-) Výsledky hledání zobrazuje úplně jiný program, než který hledá. Vyvozovat z jednoho, jak se chová druhé, není obecně možné.

K tomu ostatnímu: V němčině to máte na jednu stranu jednodušší, protože se můžete soustředit jen na Google a jiné vyhledavače Vás nemusí trápit, ale na druhou stranu složitější, protože s německými slovy Google určitě zachází jinak než s českými. Ve výsledku to bude ale asi vlastně taky jednodušší, protože u mnoha složenin může chápat i rozdělené psaní, podobně jako chápe v angličtině např. e-mail=email a on-line=online.
Petr ZZZ
Profil
Jsem zmaten. Hledaje Waldbewohner Carabus Zabra, zvýrazní hledač i prvních pět písmen řetězce Zaxxxxxky, tedy pouhou část slova, zcela jednoznačně nijak neoddělenou. Jak to tedy je? Hledá (jen?) podle slov a (až když najde?) zvýrazní i část slova?

Dodatek: Asi to bude vysvětleno tím, co píše Marek Prokop: Výsledky hledání zobrazuje úplně jiný program, než který hledá. Třeskutý dík!
Petr ZZZ
Profil
Ještě taková zajímavost, ať taky něčím přispěju, v návaznosti na tu záhadu se zvýrazněnou částí slova. Zkusil jsem hledat tři výrazy, jeden krátký, jeden delší a jeden ještě delší, přičemž ten kratší je částí toho delšího a oba jsou vždy částí toho nejdelšího. První je kus středu slova, druhý je jeho začátek a až ten třetí výraz je kompletní slovo:

ardenfo: 14 výsledků

Gepardenfo: 265 výsledků

Gepardenforelle: 45.700 výsledků

To jsou zázraky! Čím je slovo delší, tím je výsledků víc – logicky by měla být tendence spíš opačná. Myslím, že jiná interpretace, než že hledač se zajímá pouze o celá slova, není možná. Tím divnější je ovšem to označování části slova ve výsledku, jak jsem psal posledně [#9]. A zajímavé je taky, že Gepardenfo najde 265-krát, zatímco ardenfo pouze 14-krát – přitom oba řetězce jsou pouze částí slova a samotné nedávají smysl (ona ta Gepardenforelle sice ani jako celé slovo nedává smysl, ale to už je zase jiná kapitola :-) .
Marek Prokop
Profil
[#10] Petře, já na tom nic divného nevidím. Pro jistotu zrekapituluji, jak přibližně Google hledá jednoslovný dotaz:

1) Lematizátor (nebo jak tomu u Googlu říkají) vezme slovo z dotazu a podívá se do svého slovníku překlepů. Tam může zjistit 3 možnosti:

a) Může to být překlep -- pokračuj na 2a.
b) Skoro jistě to je překlep -- pokračuj na 2b.
c) Není to překlep -- pokračuj na 3.

2a) Zeptá se uživatele: "Nemyslel jste náhodou blablabla?" a pokračuje na 3.

2b) Zeptá se uživatele: "Nemyslel jste náhodou blablabla?", ale zároveň přidá slovo, o kterém si myslí, že je správné, ke slovu v dotazu jako synonymum.

3) Vezme slovo z dotazu (a případně i to podle bodu 2b) a podívá se do svého slovníku synonym. Když tam něco najde, přidá to jako synonyma k dotazu. K synonymům Google v češtině řadí i gramatické tvary (zjednodušeně řečeno).

4) Vytvoří další pravopisné tvary , tj. v češtině doplní/odřízne diakritiku, v němčině nahradí přehlásky dvojhláskami či naopak apod., a přidá je k dotazu jako synonyma.

5) Vyhledavač naváže na lematizátor a vyhledá všechny dokumenty, které obsahují alespoň jedno synonymum (jako celé slovo). Pojem "obsahují" zahrnuje i URL, souhrn textů zpětných odkazů a některá metadata.

6) Nalezené dokumenty nějak seřadí a pošle je webovému rozhraní spolu se všemi synonymy.

7) Webové rozhraní doplní HTML značky B okolo všech synonym v titulcích a úryvcích (snippetech) a celek zobrazí jako webovou stránku. V inzerátech AdWords kupodivu vytučňuje ještě jiná komponenta úplně jinak.

Už je to jasnější?
Petr ZZZ
Profil
Marku, díky moc za podrobné vysvětlení! Už je mi to o něco jasnější :-)
Toto téma je uzamčeno. Odpověď nelze zaslat.

0