Autor | Zpráva | ||
---|---|---|---|
peteo Profil |
#1 · Zasláno: 28. 1. 2013, 09:34:15
Dobrý deň, večer, ráno,
na tvorbu Sitemapp.xml mám urobeného robota, pretože sa jedná o spracovávanie veľkého množstva stránok. Viem, že xml nemerie entity tvaru & , preto som ošetril ich nahradenie znakmi tvaru %26 (oboje je & ).
Problém: aby som sa vyhol vykrikovaniu googlu o iných robotov, že kód nie je čitateľný, prispôsobil som robota, aby nahrádzal v adresách i iné znaky. A čo sa nestalo: zo cca 130000 stránok mi asi 0,5% stránok vyhodil, že ich nevie nájsť - a skutočne, po overení (ručnom) stránky hlásia chybu. Preto sa pýtam: ktoré znaky sú vyložene nečitateľné? Nakoľko odkazy sú tvorené dynamicky, v Sitemap.xml (celkom 30 súborov sitemap) sa vyskytuje (nečitaľný) odkaz: http://co-to-je.sk/spresne.php%3Fdotaz%3DAkkra [obalenie v tagoch xml je správne, chybná je iba interpretácia textu] aký je rozdiel medzi reťazcom url=http://co-to-je.sk/spresne.php%3Fdotaz%3DAkkra (error 404) a url=http://co-to-je.sk/spresne.php?dotaz=Akkra (funkčné)? Môžem teda robota smelo nechať páchať sitemap, ktorý bude obsahovať reťazec url=http://co-to-je.sk/spresne.php?dotaz= (to Akkra je už generované robotom), alebo ktoré znaky v reťazci url=http://co-to-je.sk/spresne.php?dotaz= nahradiť entitkami %xx ?
Ďakujem za pomoc. |
||
Davex Profil |
#2 · Zasláno: 28. 1. 2013, 23:42:43
1) Ve specifikaci Sitemap XML se před adresou žádné
url= nepoužívá.
2) Pokud otazník uvozuje parametry a rovnítko odděluje jméno a hodnotu parametru, tak se pro ně URL escapování %xx nepoužívá a píšou se ve své původní podobě.
3) Pro ampersand použitý pro oddělení parametrů se používá HTML entita & .
4) URL escapování by mělo být použito pouze na speciální a neASCII znaky v jednotlivých částech cesty oddělené lomítkem a ve jméně nebo hodnotě parametru. Takže správná podoba adresy v sitemap.xml by mohla být <url> <loc>http://co-to-je.sk/spresne.php?dotaz=Akkra&parametr=dal%C5%A1%C3%AD+hodnota+s+mezerami</loc> </url> |
||
peteo Profil |
#3 · Zasláno: 28. 1. 2013, 23:53:17
už sa stalo,ďakujem.
to url= je súčasťou tunajšieho BB tagu pre odkaz [url=http://www.example.com]... .
|
||
Časová prodleva: 12 let
|
0