Autor Zpráva
janomajka
Profil
Ahoj,
vím že mě za tuto myšlenku ukamenujete, ale prostě si to musím zkusit, aspoň zjistit, že to nebude fungovat.

Opět Volná místa na statni-sprava.eu . Mám připravených 30.000 url , i jsem se je pokoušel nacpat do sitemapy, buď to nešlo, nebo se url nezobrazovaly. Teď tam je jen kompletní praha, cca 300 url http://statni-sprava.eu/sitemap_index.xml . Jak tam nacpat těch dalších 29.500url? Co kdybych někde umístil všech těch 30.000 url v html odkazech? Prostě chci, aby se indeovalo vše.

Napadly mě tyto alternativy
- udělat pár subdomén, na které umístit sitemapy po 500url.
- udělat script, aby se co týden sitemap měnila
- umístit někde ty url jako odkazy
- zeptat se Vás tady, jestli někoho něco nenapadne :)

Díky

Honza
janbarasek
Profil
janomajka:
Google na mém webu indexuje přes 150 tisíc URL a stačilo k tomu vytvořit jen katalog, který na každé stránce má maximálně 20 odkazů na nějakou jinou podstránku webu. Vyhledávače nemají moc rádi, když z jedné stránky vede příliš mnoho odkazů. Sice je někdy indexují, ale mají tak mizerný rank, že jsou prakticky k nenalezení, nebo se vůbec nedostanou k robotovi.
jirka2
Profil *
janomajka:
Nepomohla by gzip komprese souboru sitemap.xml?
Martin Kolčaba
Profil
nějak nechápu, kde je problém? Prostě dejte ty URL do sitemap a tu přes Webmaster Tools předhoďte Google. On si to přebere a rozhodne se, co bude indexovat. Vše ale určitě indexovat nebude.

Co znamená "buď to nešlo, nebo se URL nezobrazovaly"? Co nešlo? Kde se URL nezobrazovaly?

Alternativy, které navrhujete, jsou nesmysly.
janomajka
Profil
janbarasek:
Google na mém webu indexuje přes 150 tisíc URL a stačilo k tomu vytvořit jen katalog, který na každé stránce má maximálně 20 odkazů na nějakou jinou podstránku webu.
Můžeš prosím poslat odkaz na tvůj web?

jirka2:
Nepomohla by gzip komprese souboru sitemap.xml?
Můžu to zkusit, ale nevím jak bych to odzkoušel.

Martin Kolčaba:
Co znamená "buď to nešlo, nebo se URL nezobrazovaly"? Co nešlo? Kde se URL nezobrazovaly?
Byl problém, aby to do xml souboru automatický cript naházel, protože xml sitemap může mít maximálně 500url, když sem jich tam dal více, url se nezobrazovaly.

Něco mě napadlo. Stránky dobraprace.cz mají cca. 400tis stránek zaindexovaných. Jako sitemap v xml mají sitemap v php - je to v xml, ale s koncovkou php - http://www.dobraprace.cz/sitemap.php Myslíte že to takhle může fungovat?

Díky
mimochodec
Profil
janomajka:
Byl problém, aby to do xml souboru automatický cript naházel, protože xml sitemap může mít maximálně 500url

Pak je to špatný automatický script. Naprogramuj si vlastní. Sitemap má nějakou doporučenou strukturu, když ji dodržíš, nic tě v počtu adres neomezuje.
janbarasek
Profil
janomajka:
Můžeš prosím poslat odkaz na tvůj web?
Hehe, tak nakonec Google indexuje 219 tisíc odkazů.
janomajka
Profil
mimochodec:
Pak je to špatný automatický script. Naprogramuj si vlastní. Sitemap má nějakou doporučenou strukturu, když ji dodržíš, nic tě v počtu adres neomezuje.

Proč se tedy tohle nezobrazuje?

http://statni-sprava.eu/pokus_sitemap_index.xml

Je to vlastní script.
mimochodec
Profil
4054:         loc>http://statni-sprava.eu/volna-mista/?time=1407845131&okres=BK&obor=VĂ˝chova+a+vzdÄ›lávánĂamp;profese=&min_mzda=&uvazek=&min_vzdelani=&str=4
janomajka
Profil
Vážně, jsou tam chybky, netuším jak se tam dostaly. Zkusím opravit. Moc díky
janomajka
Profil
Je mi blbé se ptát na takovou věc, ale kde mám chybu teď?

http://statni-sprava.eu/sitemap_komplet.xml

Děkuji


Pardon, ruším poslední dotaz, ale pravděpodobně ho za chvíli položím znova, nezlobte se :)
Bubák
Profil
janomajka:
ale kde mám chybu teď?
To je problém podívat se po nějakém nástroji na kontrolu XML?
syntaktická chyba (řádek č. 166759, znak č. 0) (je to poslední řádek)
Koukni, jakým tagem kořenový element začínáš a jakým tagem ho končíš.
janomajka
Profil
Opravil jsem kód od začátku do konce, teď je prý chyba v posledním řádku, kde je jenom </urlset>

http://statni-sprava.eu/sitemap_komplet.xml

Proč mi to teď nejde?

Díky


Na začátku je <urlset> a na konci </urlset> . Já myslím že to je vpořádku, ... ?


Nejde mi to otevřít ani v PC, ani na webu.

Není možné že jeden urlset může mít max. 500url?
mimochodec
Profil
janomajka:
Není možné že jeden urlset může mít max. 500url?

Nevím, jaks na to číslo přišel, ale ne.
Chyba není na posledním řádku, ale někde mezi. Kde, to nevím. Použij metodu půlení intervalu, najdeš to.
Mike8748
Profil
janomajka:
pro url http://statni-sprava.eu/volna-mista/?time=1407845131&amp;okres=SU&amp;obor=Finance&amp;profese=&amp;min_mzda=&amp;uvazek=&amp;min_vzdelani=&amp;str=13 není správně uzavřena xml značka url, tím se to XML rozhodilo

(na řádku 133694 je /url> , chybí otevírací závorka)
janomajka
Profil
Mike8748:
Ano, měl jsi pravdu, děkuji, ale ještě tam něco bude :(
janomajka
Profil
Tak se mi podařilo dát dohromady tohle http://statni-sprava.eu/sitemap_komplet3.xml

Ale ještě nějaká chyba je tady http://statni-sprava.eu/chyba.xml ale to už nechám na jindy

Všem moc díky za pomoc
Mike8748
Profil
janomajka:
soubor chyba.xml je v poradku, zadna chyba tam neni

pokud chybou myslis to ze to vypada tak jak to vypada, tak za to muze XSLT transformace, je to funkce toho wordpressoveho pluginu ktery pouzivas, ze v prohlizeci se ten XML soubor zobrazi takto. Google XSLT transformaci provadet nebude, uvidi normalni XML sitemapu a zpracuje ji
janomajka
Profil
Já to zpracovávám sám, jen do hlavičky jsem dal to, co bylo v sitemapě od WP.

Jinak se mi pořád zdá, že to není ok :(

V kódu je takových 16tis. url, v sitemapě na http://statni-sprava.eu/sitemap_komplet3.xml jen necelých 500.

Co bych tam měl změnit?

Díky
janomajka
Profil
Nevím jakto, ale vše už funguje tak jak má :)

Viděl sem na statni-sprava.cz , že v robots.txt mají více těch sitemap, udělal sem to taky tak - Co si o tom myslíte? Bude to fungovat?
Kubo2
Profil
janomajka:
Veď tu to máme tiež tak.
Martin Kolčaba
Profil
janomajka:
Byl problém, aby to do xml souboru automatický cript naházel, protože xml sitemap může mít maximálně 500url, když sem jich tam dal více, url se nezobrazovaly.
Není možné že jeden urlset může mít max. 500url?


ne, sitemap může obsahovat 50 000 URL, a pokud to nestačí, stačí udělat sitemap víc a udělat jejich index.

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0