Autor Zpráva
M_Válek
Profil
Zdravím. Chtěl bych se zeptat, jestli máte někdo podobnou zkušenost, případně požádat o způsob jejího řešení.

V Google Search Console mám úspěšně načteny sitemapy jednoho e-shopu (velkého), spočítané množství url v nich a v každém souboru cca kolem 35-41 000, xml souborů je přes 500. Google zobrazí u nich při pokusu o indexaci "Objeveno – momentálně neindexováno" (poslal jsem mu k ověření kolem jedné stovky sitemap prozatím, při celkovém ověřování přes index sitemap stejný problém). Když dám u "Objeveno – momentálně neindexováno" spustit OVĚŘENÍ, tak cca po dvou dnech to skončí SELHÁNÍM u pár url a na zbytek se Google vykašle. Když si dám danou url zobrazit v prohlížeči tak je funkční i testnutí url přímo Googlem přes "Kontrola adresy URL" je ok, url vrací dvoustovku, a mnohdy i obsah není fádní. Detailnější podrobnosti o selhání NEJSOU nikde UVEDENY (že by mi napsal že to skončilo kvůli pětistovce apod.). Je nějaký způsob jak objevit důvody selhání, když se vše tváří v pořádku a nebo je správce e-shopu odkázán na milosrdenství, libovůli a rozmary tohoto indexačního a vyhledávacího MOLOCHA zvaného Google?

Už jen z principu věci pokud něco selže, uvedu důvod proč. Je opravdu hezké že uvedou samotnou stránku, ale bez důvodu a ona je světe div se naprosto funkční.

Děkuji za případná info.
Kajman
Profil
Zkusil bych si udělat menší sitemapu, kde bude klidně jen 50 stránek, a zkusil to i sní (lze ji vložit ručně a nemusí být v sitemapindexu). Tím by se ověřilo, jestli to selže i pro malý seznam.
M_Válek
Profil
Kajman:
Již jsem provedl na jiném webu (ne na tom samém) a čekám výsledek dnes nebo zítra. Spíše mi jde o to, jestli někdo měl stejný problém a nějak to vyřešil, nebo zjistil jak se dopídit skutečnému problému. Momentálně vlastně ani netuším co dané selhání způsobuje (vše v reálu funguje na e-shopu, blokace crawleru přes robots.txt není, sb. sitemap jsou aktuální a bez chyb) a tak to nemohu ani vyřešit. Nebo jestli jsou to prostě jen rozmary Googlu a ani bych se nedivil. Takový mini samostatný stát kde vše je možné, že, člověk se nedovolá ničeho a nikam. Ještě ruční žádost o indexaci důležitých url probíhá v pořádku na denní bázi, takže by měl být možná problém jen v tom hromadném algoritmu procházení na straně Googlu? Dokázal bych pochopit, že je na všechno přiřazen časový a datový limit, ale pak by si Google mohl ve své velikosti toto uživatelům zahlásit, že to NESTIHL vše projít.
Kajman
Profil
Přijde mi, že sitemapy v search consoli fungují hůře než dřív. Moc to nepoužívám, ale myslím, že dřív bylo možné vidět pro každou sitemapu zahrnutou do siteindexu zvlášť počet indexovaných stránek z ní. Třeba pro tuto doménu je možné zobrazit jen celkový stav indexace ze všech sitemap a jednotlivé nejdou. (Jsou tu rozdělené dle roků a největší má 25 000 adres a tento týden byla zpracována.)

Na jiné doméně jsou dvě sitemapy a o té jedné tvrdí, že ji navštívil naposledy v říjnu 2022, i když tam přibývá stránka každý týden.

Ještě se zkuste přepnout do angličtiny. Dříve se mi stávalo, že některé aplikace od google toho uměly víc v angličtině. Ale moc šancí tomu nedávám že by tam bylo více informací.

A v indexing - pages jsou nějaké důvody neindexace stránek, které zná?
Firibix
Profil
Má zkušenost je taková, že u stavu „Objeveno – momentálně neindexováno“ není rozdíl mezi selháním a úspěchem ověření. Na webu, který spravuji, také byly tisíce stránek neindexovaných. Ověření proběhlo úspěšně, ale jen potvrdilo, že stránky nejsou indexovány a do indexu je nezařadilo.
M_Válek
Profil
Kajman:
Moc to nepoužívám, ale myslím, že dřív bylo možné vidět pro každou sitemapu zahrnutou do siteindexu zvlášť počet indexovaných stránek z ní. Třeba pro tuto doménu je možné zobrazit jen celkový stav indexace ze všech sitemap a jednotlivé nejdou.
No, to jsem zjistil taktéž když jsem nahrál pouze index sitemap. Takže jsem celý index odstranil, sice ho znovu nahrál aby o něm crawler věděl, ale k tomu jsem nahrál i jednotlivé soubory sitemap a u každé jednotlivé už jde (za pár dnů po zpracování - načtení) zobrazit počet indexací. Většinou z 40 tisíc indexuje při vstupu do 10 url :-) . Jazykovou mutaci jsem zkusil a žádný rozdíl. Žádné konkrétní důvody neindexace uvedeny nejsou, jen url u kterých proběhlo selhání + nevyřízené (zbytek) asi se do dalších nepouštěl.

Děkuji za zkušenost.


Firibix:
Aha, tak potom otázkou, proč tam to ověření vůbec Google má, že.... Přijde mi to od nich úsměvné, že se tedy tváří jakože mají nějaký funkční nástroj, ale přitom skutek utek a stejně si jedou svojí politiku. Děkuji taktéž za zkušenost.

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0