Diskuse JPW: Google nechce načíst sitemap

	Autor	Zpráva
	Patrik C. Profil *	#1 · Zasláno: 9. 4. 2020, 14:55:00 Odpovědět Citovat Dobrý den, mám problém s kterým si bohužel nevím rady... Přidal jsem do google search console Index souborů Sitemap, ten se podařilo načíst správně... Bohužel soubory, které jsou v něm už google načíst nechce, ani když jeden z nich vemu a dám ho do google search console natvrdo... Píše pořád nelze načíst, xml mám správně. Nepotkal se někdo s touto chybou ? Děkuji
	Kajman Profil	#2 · Zasláno: 11. 4. 2020, 22:19:50 Odpovědět Citovat Patrik C.: „xml mám správně“ Ještě bych zkontroloval http hlavičky a robots.txt. A pak případně ještě jednou XML :-) Neznám obdobný nástroj od seznamu, ale pokud tam jdou také dávat sitemapy, tak zkuste dát tu podmapu i tam, třeba tam bude ukecanější chybová hláška.
	Patrik C. Profil *	#3 · Zasláno: 12. 4. 2020, 16:55:47 · Upravil/a: Patrik C. o 9 minut později Odpovědět Citovat Uz jsem zkoušel fakt všechno, Index souboru sitemap to nacte, i odkazy na ne, zkoušel jsem i dát mene nez 50 000 url adres na soubor, ted mam 30 000, proste to nechce nacist, uz tyden to resim a stále nic... :( zacinam mít chute vyhodit notas z okna... Ukládám to v UTF8, vse podle norem www.sitemaps.org/protocol.html, proste je to divny :D v robots.txt mam jen sitemap
	lionel messi Profil	#4 · Zasláno: 12. 4. 2020, 17:05:13 Odpovědět Citovat Patrik C.: Možno by pomohlo ukázať nám „http hlavičky a robots.txt a pak případně ještě XML“.
	Patrik C. Profil *	#5 · Zasláno: 12. 4. 2020, 17:10:39 · Upravil/a: Patrik C. o 33 minut později Odpovědět Citovat lionel messi: http hlavičku nemám kde kontrolovat, ukládám to do xml, nemám live sitemap Robots: User-agent: * Allow: / Sitemap: https://www.adresawebu.com/sitemap.xml Sitemapu to nacte, odkazy v ni na systemapu to take nacte, v search console kdyz pak dam otevrit jeden z nactenych souboru, ktery nechce nacist url adresy, tak se otevre v poradku... Každý xml začiná: <?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> a obsahuje pouze `<url><loc>adresa</loc></url>` ano xml mam ukonceny `</urlset>` Když data zobrazím v prohlížeči, vypíše se mi <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc> adresa </loc> </url> <url> <loc> adresa </loc> </url> <url> <loc> adresa </loc> </url> <url> ...... Nemuze to byt tim, ze adresa neni ve stejnem radku jako `<loc>` ? accept-ranges: bytes age: 2 cache-control: max-age=600 content-encoding: gzip content-length: 33316 content-type: application/xml date: Sun, 12 Apr 2020 15:17:25 GMT etag: "7983f-5a3195a1463c5-gzip" expires: Sun, 12 Apr 2020 15:27:25 GMT last-modified: Sun, 12 Apr 2020 15:09:24 GMT server: ATS status: 200 vary: Accept-Encoding Tak ta struktura nevim proc se tak vypisuje, kdyz soubor po 5ti minutovém načítání otevřu v editoru :D, mám to v pořádku a bez mezer Validátor: www.xml-sitemaps.com/validate-xml-sitemap.html me vypise se je vse v poradku, zadne upozorneni ani chyba...
	Kajman Profil	#6 · Zasláno: 12. 4. 2020, 20:54:27 Odpovědět Citovat Patrik C.: „zkoušel jsem i dát mene nez 50 000 url adres na soubor“ Jasně, proto se dělají seznamy sitemap, protože v jedné nesmí být více jak 50 000. Také (nezagzipovaný) xml soubor nesmí být větší než 50MB. Je možné, že tím, že jste měl přes 50 000 url v jednou souboru, googlebot ho ani po opravě nebere vážně. Zkuste opravenou sitemapu přejmenovat a znovu přidat přes konzoli tu přejmenovanou variantu s omezeným počtem url.
	Patrik C. Profil *	#7 · Zasláno: 13. 4. 2020, 11:04:03 · Upravil/a: Patrik C. o minutu později Odpovědět Citovat To jsem samozrejme zkousel a nikdy jsem 50 000 nepresahnul, mel jsem vzdy mene, napr: 48 000 apod, samozrejme velikost tak velkou nemam, mám jen cca 2,5mb. Prejmenovat jsem zkousel, ted jsem pridal dva soubory, bez seznamu sitemap, vzalo to dva soubory po 25 000 url a dalsi uz pise, ze je nemuze nacist... :D Pritom jsou generovany ve stejny cas, stejnym scriptem, takze tim to neni, maji jiny nazev nez predtim, tak ja nevim uz, asi me jebne...
	Tomášeek Profil	#8 · Zasláno: 13. 4. 2020, 11:41:54 Odpovědět Citovat Patrik C.: Možná by pomohlo, kdybychom se přestali bavit obecně a začali se bavit konkrétně. Ukaž konkrétní soubor, se kterým máš problém.
	Patrik C. Profil *	#9 · Zasláno: 13. 4. 2020, 13:15:56 Odpovědět Citovat Tomášeek: Sitemapa souboru: www.rikrek.com/sitemap.xml Ráno jsem vložil do search console: www.rikrek.com/sitemap/sitemap_filmy_cs_105.xml a www.rikrek.com/sitemap/sitemap_filmy_cs_106.xml, jen tak náhodile, vzalo to, a zkusil jsem www.rikrek.com/sitemap/sitemap_filmy_cs_111.xml a uz to nevzalo... kazdy soubor obsahuje 25000 url a má cca 2,5mb
	Kajman Profil	#10 · Zasláno: 13. 4. 2020, 14:58:53 Odpovědět Citovat Např. první soubor www.rikrek.com/sitemap/sitemap_filmy_cs_1.xml Má na začátku <?xmlversion="1.0"encoding="UTF-8"?><urlsetxmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> asi Vám vypadly mezery... <?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> Takovou chybu přece musí každý parser najít. Do sitemapy bych nedával žádné url, kde nic není (nejsou např. alespoň 2 nebo 3 položky - tedy víc, než je vidět na hlavní stránce filmu) www.rikrek.com/cs/film/the-structure-of-crystals/343784/hodnoceni www.rikrek.com/cs/film/the-structure-of-crystals/343784/zajimavosti www.rikrek.com/cs/film/the-structure-of-crystals/343784/doporuceni www.rikrek.com/cs/film/the-structure-of-crystals/343784/komentare Naopak bych je na hlavní stránce do té doby označoval jako nofollow. Tipnul bych, že u nepolámaných souborů prostě google bot vidí spoustu duplikátů bez obsahu. A nedůvěřuje té doméně natolik, aby indexoval milióny url, kde po ostranění omáčky vlastně nic není.
	Patrik C. Profil *	#11 · Zasláno: 13. 4. 2020, 15:32:25 Odpovědět Citovat Kajman: Díky za reakci, nofollow jsem již aplikoval a ze sitemap odkazuji uz jen na main page filmu, tak uvidíme, co na to řekne google za pár dní a snad sitemapu načte...
	Kajman Profil	#12 · Zasláno: 13. 4. 2020, 15:34:28 Odpovědět Citovat A snažil bych se přidat do sitemap správný <lastmod>, aby robot věděl, které stránky potom reindexovat jako první a které by měly být stejné jako při poslední návštěvě..
	Patrik C. Profil *	#13 · Zasláno: 13. 4. 2020, 15:41:58 Odpovědět Citovat Kajman: Chápu, budu se snažit v co nejkratší době přidat...
		Časová prodleva: 6 let

Vaše odpověď

Mohlo by se hodit