Autor Zpráva
latté
Profil *
Dobrý den,

je jasné, že téměř všechny stránky jsou zčásti duplicitní - když je web o 100 stránkách, zpravidla všechny mají stejné menu, stejné záhlaví, stejné zápatí apod. Tato "částečná duplicita" očividně vyhledávačům nevadí.

Nemá však někdo tušení, kolik % obsahu může být na stránce duplicitní - tak, aby to vyhledávače nijak nepenalizovaly?

(a mluvím stále o obsahu v rámci jedné domény, čili duplicitní obsahy by se vyskytovaly pouze na stránkách té samé domény... což u googlu už asi nemá vliv, u seznamu nejspíš ano)

Uvítám i hrubé odhady, prostě za každý názor dík.
Enyeus
Profil
Nejde o HTML duplicitu, ale kopírování textů.
latté
Profil *
tj, ale v menu, v lištách, v zápatí... tam jsou přece taky texty
ninja
Profil
latté: penalizace se bát nemusíte. Vyhledávač jen z úsporných důvodů bude zobrazovat ve výsledcích jen jednu stránku z těch několika duplicitních.

Kde se láme duplicitní/neduplicitní posoudit nedokáži a myslím že to ani není třeba. Co může vyhledávač považovat na jednu klíčovou frázi jako duplicitní, na jinou může stejné stránky brát jako jedinečné, protože se budou lišit práve v obsahu té hledané fráze.
latté
Profil *
ninja:Děkuji. Dovolím se ještě zeptat konkrétně: chci propagovat svou službu ve všech 77 okresech. Chci tedy, aby při zadání "služba + jakýkoli okres" byla moje stránka první. Ale abych toho dosáhl, musel bych mít 77 stejných stránek o cca 6000 znacích textů, přičemž jediné, v čem by se lišili, by byl titulek (jiný okres) a pak v obsahu by též byl uveden jiný okres + výpis jiných obcí daného okresu. Ve zbytku obsahu by bylo všech 77 stránek stejných.

Myslíte, že by vyhledávače všechny zaindexovaly? A když ano, nedostanu hned na úvod nějakou penalizaci?

Děkuji za názor
Marek Prokop
Profil
[#5] Myslím, že popisovaný případ by už byl za hranicí korektní optimalizace a snažil bych se tedy najít jiné řešení. Je to jen můj osobní názor podložený pouhou intuicí.
Tomáš Meisner
Profil
[#5] latté
Vyhledávače dnes již umí tzv. "blokovou analýzu obsahu stránky" - tzn. umí určit co je na stránce navigace, co je patička, hlavička, ale především co je textový obsah. Duplicitní kontrola se pouští právě jen na textový obsah. Takže pokud budete mít komplet stejné texty, tak je značně pravděpodobné, že některé (všechny až na jednou) stránky nebudou zaindexované. Penalizaci nedostanete.

Jak říká Marek Prokop - tohle není uplně ideální řešení. Vím, že se Vám může zdát 77 stránek dost, aby se dělaly různé texty, ale uvidíte že se Vám to vyplatí (alespoň nějaké rozdíly mezi texty). Ono se to dá i trošku zautomatizovat, ale ani to není ideální...
Petr ZZZ
Profil
Snad mohu posloužit praktickým příkladem. Mám na stránkách obrázky brouků, každý obrázek je (až na několik výjimek) na samostatné stránce. Dával jsem je na web v několika vlnách, naposledy ale před několika měsíci, takže všechny jsou dostatečně staré. Některé stránky najde Google v pohodě, jiné řadí hůř a některé snad ani vůbec neřadí. Lépe řadí ty, na kterých je víc textu, ale jsou i stránky s dost textem, které přesto ignoruje. Špatně je na tom třeba Rhagium – zde asi půjde o duplicitu, protože mám čtyři fotky jednoho druhu a každou na extra stránce, současně je málo textu; podobně je tomu s rodem Lucanus a asi i u různých druhů rodu Saperda bude závadou duplicita (i když to jsou různé druhy), možná ale taky málo textu. Špatně je na tom ale taky Ptosima a většina druhů rodu Carabus – u těch nevím, čím to je, přitom některé stránky mají obsahu dost a Ptosimu mám jen jednu na celé prezentaci. Nejlíp jsou na tom stránky se spoustou textu (Capnodis, Dicerca), ale i některé se skromným množstvím textu (Denticollis – ten má ale odkaz navíc na úvodní stránce webu). Různá intenzita konkurence samozřejmě i zde hraje roli, ale taky nevysvětlí všechno. Shrnu-li to, mám tendenci říct "čert aby se v tom vyznal", ale jinak si myslím, že udělat stránky pro uživatele je nejlepší cestou k úspěchu – potom tolik nevadí, když tu a tam něco ve vyhledávání pokulhává. Výhodou je, když se jedná o vlastní stránky a ne o stránky dělané pro zákazníka – pak se na to člověk dívá z nadhledu a s větším klidem. A dobrá je dlouhodobá strategie. V těchto bodech spočívá myslím také úspěch JPW.

Uvádím zde výsledky hledání v němčině, protože web je německy a běží na rakouském hostingu (Seznam o mně myslím moc neví a český Google asi taky ne):

Capnodis(text)
Capnodis(obrázky)
Carabus (text)
Carabus (obrázky)
Denticollis (text)
Denticollis (obrázky)
Dicerca (text)
Dicerca (obrázky)
Lucanus (text)
Lucanus (obrázky)
Ptosima (text)
Ptosima (obrázky)
Rhagium (text)
Rhagium (obrázky)
Saperda (text)
Saperda (obrázky)

S dalšími příklady si lze dle libosti pohrát – těch brouků je tam něco přes sto stránek; stačí zadat do vyhledávače třeba nějaké rodové jméno a sledovat, kde se umístila doména.

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: