Autor Zpráva
peteo
Profil
Dobrý deň, večer, ráno,

na tvorbu Sitemapp.xml mám urobeného robota, pretože sa jedná o spracovávanie veľkého množstva stránok.
Viem, že xml nemerie entity tvaru &, preto som ošetril ich nahradenie znakmi tvaru %26 (oboje je &).

Problém:
aby som sa vyhol vykrikovaniu googlu o iných robotov, že kód nie je čitateľný, prispôsobil som robota, aby nahrádzal v adresách i iné znaky.
A čo sa nestalo:
zo cca 130000 stránok mi asi 0,5% stránok vyhodil, že ich nevie nájsť - a skutočne, po overení (ručnom) stránky hlásia chybu.
Preto sa pýtam:
ktoré znaky sú vyložene nečitateľné?
Nakoľko odkazy sú tvorené dynamicky, v Sitemap.xml (celkom 30 súborov sitemap) sa vyskytuje (nečitaľný) odkaz:
http://co-to-je.sk/spresne.php%3Fdotaz%3DAkkra

[obalenie v tagoch xml je správne, chybná je iba interpretácia textu]

aký je rozdiel medzi reťazcom
url=http://co-to-je.sk/spresne.php%3Fdotaz%3DAkkra (error 404) a
url=http://co-to-je.sk/spresne.php?dotaz=Akkra (funkčné)?

Môžem teda robota smelo nechať páchať sitemap, ktorý bude obsahovať reťazec url=http://co-to-je.sk/spresne.php?dotaz= (to Akkra je už generované robotom), alebo ktoré znaky v reťazci url=http://co-to-je.sk/spresne.php?dotaz= nahradiť entitkami %xx?

Ďakujem za pomoc.
Davex
Profil
1) Ve specifikaci Sitemap XML se před adresou žádné url= nepoužívá.
2) Pokud otazník uvozuje parametry a rovnítko odděluje jméno a hodnotu parametru, tak se pro ně URL escapování %xx nepoužívá a píšou se ve své původní podobě.
3) Pro ampersand použitý pro oddělení parametrů se používá HTML entita &.
4) URL escapování by mělo být použito pouze na speciální a neASCII znaky v jednotlivých částech cesty oddělené lomítkem a ve jméně nebo hodnotě parametru.

Takže správná podoba adresy v sitemap.xml by mohla být

<url>
  <loc>http://co-to-je.sk/spresne.php?dotaz=Akkra&amp;parametr=dal%C5%A1%C3%AD+hodnota+s+mezerami</loc>
</url>
peteo
Profil
už sa stalo,ďakujem.

to url= je súčasťou tunajšieho BB tagu pre odkaz [url=http://www.example.com]....

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0