Autor Zpráva
Ost512
Profil *
Dobrý den, existuje nějaký prográmek, který by mi ukázal kolik stránek má můj web, kolik z nich je indexovaných (a kolik ne), kolik má můj dynamických a statických stránek? A to vše včetně historie a tedy možnosti sledování? Je nějaký takovýto program "all in"?
Cody
Profil
Xenu umí zjistit počet stránek, kolik jich je indexovaný už nyní přesně nezjistí nikdo.
ninja
Profil
Počet indexovaných stránek můžete zjistit pomicí Google Webmaster tools.

Jestli je stránka dynamická nebo statická zjistíte pouze sám. Jakmile je stránka vygenerována a poslána prohlížeči, není v nich rozdíl.
Cody
Profil
ninja:
Počet indexovaných stránek můžete zjistit pomicí Google Webmaster tools.

A liší se ten počet od výsledků z operátoru site:?
helpik.JPW
Profil
Cody:
add GWT - někde jsem kdysy četl nebo slyšel, že GWT zobrazuje počet indexovaných stránek nahodile a nespolehlivě a že je tato hodnota nevypovídající. Je to ale informace pro mě cca rok stará a GWT se stále vylepšuje. Z mého pohledu těžko říci.

add site: operátor site u G. ovlivnuje více faktorů, například i to, že je určitá stránka nejdříve zaindexovaná, za nějakou dobu ne (vyhodnocena jako duplicitní nebo nerelevatní -> přesunutí (třeba jen na čas) do "nezobrazovaných").

Sice občas zjištuji zaindexovanost webu, ale spíše na začátku nebo když jsou nějaké větší problémy. Jsou mnohem důležitější věci na sledování.
ninja
Profil
Počet indexovaných stránek, co GWT uvadí u počtu indexovaných stránek z sitemap, je dle mých zkušeností velmi přesné. Druhá věc je že takový údaj není v zásadě nijak zajímavý. Použe může poukázat na nějaký technický problém, o úspěšnosti ve vyhledávačích to nic neříká...
helpik.JPW
Profil
ninja:
Počet indexovaných stránek, co GWT uvadí u počtu indexovaných stránek z sitemap, je dle mých zkušeností velmi přesné
- Děkuji za tuto informaci.

Druhá věc je že takový údaj není v zásadě nijak zajímavý. Použe může poukázat na nějaký technický problém, o úspěšnosti ve vyhledávačích to nic neříká
- úplný souhlas
Cody
Profil
ninja: No je to velmi důležitý údaj - alespoň pro mě, nás, protože pokud je přesný je to jediný případ kdy to vyhledávač (Google) řekne, site: není přesný a právě tohle číslo často může být prvním indikátorem problému. Díky za objasnění.
ninja
Profil
Cody: To máte pravdu, ale jak jsme psal, je důležité co tím Google řiká: "Ano, tuto URL znám, byl jsem na ní." Rozhodně tím neříka, že ji zahrne do výsledků na nějaký dotaz, natož na doboru pozici.

Proto Vám pomůže jen k odstranění případné techncké chyby, která by zabránila Googlu botu vaše stránky procházet.
helpik.JPW
Profil
Indexovaná stránka je stránka, 1/ kterou robot navštívil a 2/ momentálně se dle svého algoritmu rozhodl ji uveřejnit. Algoritmus zhodnonocuje mnoho faktorů, takže robot může stránku navštívit, uznat jako relevantí k nějakému dotazu a umístit do indexu ... nebo navštíví a jen na nějaký krátký čas umístí do indexu a pak ji na ča vyhodí apod. Pochybuji, že i super web má (dle sitemapy) 100% indexovanost.
Problém samozřejmě je, pokud číslo zaindoxavaných najednou začne klesat (časté u ang. stránek) . Může to být malwarem a nebo něčím jiným.
Nicméně si zatím stojím za tím, že nemá přísliš smysl často zaindexovanost webu sledovat. Problémy se totiž projeví celkovou návštěvností webu a to se, narozdíl od indexace, diagnostikuje problém snáze.
Takže souhlasím s posledním Cody s tím, že předpokládám správné nastavení robots.txt o správném procházení stránky robotem.

Ale mohu se plést
Petr ZZZ
Profil
helpik.JPW:
Pochybuji, že i super web má (dle sitemapy) 100% indexovanost.

V této diskuzi hledá Google a neuvědomuji si, že by nenašel něco, o čem jsem věděl, že tu musí být; možná tu opravdu indexuje sto procent.

Kajman: Díky, zajímavé.
Kajman_
Profil *
Petr ZZZ:
možná tu opravdu indexuje sto procent.
Diskuse má nyní indexováno jen 98.5% adres ze sitemapy.
ludekbrno
Profil *
helpik.JPW:
Já mám dva středně veliké weby, jeden má v sitemap 70 url a dle GWT je zaindexovaných 70, tedy 100% a je to dlouhodobý stav. Druhý web má momentálně 153 url a zaindexováno je 151. Ale tam přibývá cca 1x týdně článek a díky určitému zpoždění indexace je jich v indexu o 1-3 url méně, než na webu v danou chvíli mám. Ale kdybych to nechal 14 dní uležet, tak bude bez problému taky 100%.

Toho stavu 100% indexace se dá dosáhnout snadno tak, že se pomocí robots.txt vyloučí procházení všech neobsahových a duplicitních url. Tedy zablokují se prihlašovací formuláře, kontaktní formuláře a podobné url, na kterých není žádný užitečný obsah. Potom zbydou jen url s obsahem a pokud je ten obsah aspoň trochu zajímavý a unikátní, google ho témeř jistě zaindexuje a není žádný problém dosáhnout 100% indexaci.
helpik.JPW
Profil
Petr ZZZ:
- možná příliš složitě napsáno ;)
- nenapsal jsem, že má japsatweb nejspíš míň jak 100% ;)


ludekbrno
- právě - mám zkušenost s weby, kde se aktualizuje a přidává obsah. Proto jsem snad 100% neviděl. Dříve jsem tuhle hodnotu na obyčejných webech nesledoval, takže u nich nevím.
- každopádně děkuji za logickou věc, která mě dříve s robots.txt nenapadla - vyloučit stránky s formuláři a neobsahové stránky nebo neužitečné stránky. Většinou jsem nastavil na složku adminqqq a sitemap a dál to nechal být.
ludekbrno
Profil *
Typická chyba, zapsat do robots.txt složku admin. 1) se do ní bez prihlášení roboti stejně nedostanou, takže je to zbytečné, 2) obvykle do ní nevedou z veřejné části odkazy a robot o ní neví, tedy taky zbytečné a 3) potencionálním útočníkům ukážeš přístup, kde je přístup do administrace, takže je to navíc ještě nebezpečné! Složka administrace a vůbec všechny neveřejné složy webu nemají v robots.txt co dělat. Nevím proč tolik lidí dělá přesný opak, toto tam dá a co tam patří, tam jedá :-)
helpik.JPW
Profil
ludekbrno:
add "v robots admin složka":
- něco na tom bude

Teď jsem zrovna koukal na úplně nový eshop, kterému jsem předevčírem podstrkával sitemapu a v GWT z 637 indexuje 238 :( Předpokládám, že to Google do 14 dnů přehodnotí.
Jako typ je uveden obrázky.
Zobrazit adresy URL: Nenalezeno ‎(20)‎ - to musím postupně opravit
Omezeno souborem robots.txt ‎(3)‎
V souborech Sitemap ‎(3)‎

Nic moc tedy
Ost512
Profil *
Ještě se malinko vrátím k mému úvodnímu dotazu. Mimochodem děkuji za průběžné rady.
SEO analyzator na www.seonastroje.cz mi ukazal 84%. Vykázal tyto chyby:
1) analyzátor ukázal, že mám 2x H1 nadpis (chybou webnode, neopravitelné)
2) validátor - podobné jako bod jedna, ale s tím rozdílem že ve validaci kódu mám 3 neopravitelné chyby
3) inline styly - stránka je obsahuje do externich souboru nejdou přesunout
Chápu, že web se píše pro lidi, chápu, že význam některých údajů v SEO je přeceňován, přesto se ptám:

Bude mít vliv 84% na vyhledatelnost webu když nemám 100%?
Správné SEO je jedním z faktorů pro pozicování takže to mou pozici může ovlivnit?
Jsou zmiňované chyby nutné k opravě?
Nebo je daných 100% vhodných zejména pro ranking stránek? znovu děkuji
Plaváček
Profil
Ost512:

Ani jeden z bodů, které hlásá "SEO analyzátor", nemá žádnou souvislost s oborem SEO. Malá glosa k přečtení: http://zdrojak.root.cz/clanky/pojednani-o-zbytecnosti-seomatu/
Ost512
Profil *
Plaváček:
Lidé v dané diskuzi to zase tak nevidí. Chcete mi říct, že všechny ty chyby nemají vůbec vliv?Chybně vytvořený web vlastně vůbec nevadí pro uspěšné dohledání? To by pak znamenalo že SEO je vlastne jen o keywords a linkbuilding.
Chamurappi
Profil
Reaguji na Osta512:
Chybně vytvořený web vlastně vůbec nevadí pro uspěšné dohledání?
Který z těch tří bodů považuješ za opravdovou chybu? Bezchybně funkční web bývá úspěšně dohledatelný.

Mohl bys prosím uvést adresu svého webu?
Ugo
Profil
1. Chybně vytvořený web bude obsahovat chyby, například ti hodí php fatal error a nic víc, takový web bude těžko dohledatelný a i slavnému analyzátoru se z něj asi zatočí hlava. To co hledají analyzátory ale chyba není a být nemůže, oni se k tomu webu také potřebují dostat, čili mohou zkontrolovat pouze bezchybný web v podstatě.

2. Ano SEO je víceméně pouze o klíčových slovech a vhodných odkazech.

3. To jaké zvolíš klíčové slovo do h1, strong atp. může mít určitý malý vliv, ovšem to ti analyzátor nepoví, řekne ti nesmysl jako že tam más 2x h1 a inline styly což nemá vliv žádný takže jsme zpět u toho .. je to jen o slovech a odkazech
Cody
Profil
Ost512:
Lidé v dané diskuzi to zase tak nevidí. Chcete mi říct, že všechny ty chyby nemají vůbec vliv?Chybně vytvořený web vlastně vůbec nevadí pro uspěšné dohledání? To by pak znamenalo že SEO je vlastne jen o keywords a linkbuilding.

Mě přijde - z diskuse pod článkem - krom jednoho člověka, že to tak jednoznačně vidí, technická stránka webu je v SEO spíše minoritní, tvrdí se okolo 20%. Ačkoliv s tím článkem absolutně nesouhlasím, přijde mi zajímavý pro vysvětlení celého problému http://www.seomoz.org/article/search-ranking-factors.

Ugo:
2. Ano SEO je víceméně pouze o klíčových slovech a vhodných odkazech.

Přesněji více, než méně. Ale pokud web nebude indexovatelný a nebude mít obsah, tak mu ani klíčová slova zpětné odkazy nepomohou. Já bych to nerad takhle hrubě vulgarizoval, protože to pak vede ke spamu a jiným ošklivým věcem.
helpik.JPW
Profil
Ost512:
- SEO analyzátory a SEO matech jsou skoro k ničemu. Nejspíše Vám ukradnou klíčová slova a použíjí je a jsou tak Vašimi konkurenty ve výsledcích vyhledávání. Jejich tvůrce chce poukázat na to, že testovaný web je špatný a přilákat pro sebe zákazníka.
- poctiví SEO konzultanti mají o SEO analyzátorech či SEOmatech jasno - co je SEOmat
- je asi jasné, že meta tagy title a description důležité jsou, ale nepotřebujete takovét nástroje, aby jste zjistil, že jsou mega dlouhý nebo chybí. K tomu může napomoci zdarma nástroj od Googlu - GWT, který Vám poslouží i mnohých jiných směrech a chybách
- SEO analyzátory a SEO maty - využívají neznalosti člověka testujícího daný web

- neustálý boj SEO konzultantů majitelům stránek je mimo jiné:
-- vysvětlování principu SEO analyzátorů a SEO matů
-- vysvětlování pozic

Cody:
Přesněji více, než méně. Ale pokud web nebude indexovatelný a nebude mít obsah, tak mu ani klíčová slova zpětné odkazy nepomohou. Já bych to nerad takhle hrubě vulgarizoval, protože to pak vede ke spamu a jiným ošklivým věcem.
- souhlasím. Bez kvalitního obsahu obsahujícího vhodná kws (nejlépe i v nadpisech) se optimalizace bude projevovat, ale pomaleji a ne s třeba zcela spokojeným výsledkem

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Odkud se sem odkazuje


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0