Autor Zpráva
err
Profil *
Ahoj,
co má být v sitemap? Mají tam být jen t co je v menu + rubriky k článkům? použil jsem toto: www.xml-sitemaps.com
a ono mi tam do <loc> dalo i některé samotné články...
Kajman
Profil
Vše.
err
Profil *
Kajman:
Vše.
Takže všech 10 000 článků?
Kajman
Profil
Jistě. Když tam dáte čas poslední úpravy každé stránky, tak roboti budou mít nápovědu, kam jít a co už znají. Můžete to i rozdělit na více map a v sitemap.xml mít odkazy na ně. Mrkněte na sitemapu této diskuse, tam je odkazů ještě o řád víc.
err
Profil *
Kajman:
já sitemapu v hlavičce nikde nevidím. Kde ji mám najít?
Kajman
Profil
Odkaz na sitemapu pro roboty se umísťuje do robots.txt
err
Profil *
a neni chyba když mám v head html hlavičce
<meta name="robots" content="noindex, nofollow">
a zároveň mám robots.txt s
User-agent: *
Disallow:

nebo ten metatag mám vymazat?
cesta s robots.txt musí být v hlavním adresáři. - v html hlavičce na něj nemusím odkazovat?


oprava: v hlavičce mám <meta name="robots" content="all">
Kajman
Profil
Pokud chcete zakázat přístup robotům, tak můžete použít to noindex nebo disallow pro *. Ale pokud to takto všem robotům zakazujete, nechápu, proč chystáte sitemapu.
err
Profil *
hm... ještě bych potřeboval poradit k tomu .xml.gz

mám tam tohle:

$xml_header = '<?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">';
$xml_footer = '</urlset>';
fwrite($my_file, gzencode($xml_header.$data_data.$xml_footer, 9));

Dělám to správně? nemá v té proměnné být něco jiného když se generuje .xml.gz soubor? Když procházím sitemap tady na diskuse jakpsatweb tak se mi ten xml.gz normálně zobrazí v prohlížeči a když to stejné udělám na mém webu tak mi to nabídne stažení nebo otevření souboru přes winrar.


na seznamu píšou tohle: Sitemapy lze použít i v komprimovaném stavu. Podporujeme komprimaci metodou gz. Lze též použít standardní název sitemap.xml a v hlavičkách posílat Content-Type (application/x-gzip). napoveda.seznam.cz/cz/fulltext-hledani-v-internetu/sitemap-xml


kam mám dát tu hlavičku?


<url>
<loc>
https://www.mujweb.cz/article/skolni-pastelky
</loc>
</url>

může v tom xml být jenom loc nebo tam musím mít i lastmod a priority?
Kajman
Profil
Http hlavičku na xml můžete změnit např. v .htaccess, aby si ho mohli prohlížet i obyčejní lidé. Také je potřeba říci, že už je zabalený a nemá ho server balit ještě jednou. Zkuste např.

RewriteRule ^sitemap.*\.xml\.gz$ - [T=application/xml,E=no-gzip:1]

<FilesMatch "(\.xml\.gz)$">
    # Serve correct encoding type.
    Header set Content-Encoding gzip
    # Force proxies to cache gzipped & non-gzipped xml files separately.
    Header append Vary Accept-Encoding
</FilesMatch>

Bez uvedení lastmod ta sitemapa robotům tolik nepomůže, aby se zaměřily na čerstvá data. Mají na Váš web omezené prostředky, díky lastmod jim můžete pomoci, aby je efektvině využily. Pritority nastavovat nemusíte.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0