Autor Zpráva
peteo
Profil
dobrý deň,

prevádzkujem dva podobné weby, jeden starší statický Lexikón a novší, dynamický Heuréka.

Kde vidím problém.

Na statických stránkach bez problémov vyhľadávače nájdu kopec slov, na základe ktorých sú stránky často nájdené, teda sú relatívne in. Na dynamických stránkach mám tieto slová v externých súboroch (bez prípony).

Dotaz: ako nájdu vyhľadávače tieto slová, keď sú stránky robené pomerne malým súborom v php a až do neho slová vkladané skriptom z externých súborov?
Ukladajú do medzipamäte stránky napr. http://heureka.tym.sk/vys.php?dotaz=slon, na základe čoho by mohli stránky indexovať?

Ak nie, ako vyhľadávače prinútiť, aby to robili? (a tým boli stránky samozrejme indexované)

Ďakujem.
Chamurappi
Profil
Reaguji na petea:
nájdu vyhľadávače tieto slová, keď sú stránky robené pomerne malým súborom v php a až do neho slová vkladané skriptom z externých súborov?
Vyhledávače (stejně jako lidští návštěvníci) nemají šanci zjistit, jakým způsobem je stránka na straně serveru sestavovaná.

Ak nie, ako vyhľadávače prinútiť, aby to robili? (a tým boli stránky samozrejme indexované)
Vyhledávače mohou indexovat jen to, na co vedou odkazy.
peteo
Profil
Takže mám vytvoriť stránky, na ktorých bude 100.000 odkazov?

Absurdné.
Marek Prokop
Profil
Peteo, Chamurappi Vám odpověděl naprosto správně, ale možná si jeho odpověď špatně vykládáte. Nemusíte mít 100 tisíc odkazů na jedné stránce. Pokud má ale celý Váš web 100 tisíc stránek, pak musejí být vzájemně nějak prolinkované a celkem se bude jednat jistě o víc než 100 tisíc odkazů.

Nic absurdního na tom není.
peteo
Profil
no práve, po prerobení zo statického webu na dynamický sa odkazy ukazujú už iba ako niečo za otáznikom v http://heureka.tym.sk/vys.php?dotaz=slon, teda odkaz slon, ktorý predtým vyhľadávač (po prejdení textu v stránke) našiel, teraz nenachádza.
Pokiaľ budú existovať odkazy vo vygenerovanej stránke, akceptuje vyhľadávač i tieto odkazy, teda niekde ukladá vygenerované stránky napr. už uvedenú http://heureka.tym.sk/vys.php?dotaz=slon do cache?.
Lebo potom skutočne neostáva nič iné, len urobiť statickú stránku s odkazmi, keď vyhľadávač neakceptuje dynamické stránky.

Keď si napr. pozriete Google, kde je zadaný výraz na vyhľadávanie Alleghany, tak v statických stránkach je nájdený, kdežto v dynamických nie, pričom na Alleghany nikde nie je vedený odkaz; proste Google ho našiel v obsahu stránok. A to neurobí na dynamických stránkach. Preto chcem vedieť, ako dosiahnem, aby toto, čo urobí na stytických stránkach, urobil aj na dynamických.

Možno by to išlo cez Sitemap, ale tam nie sú povolené zástupné znaky (*), takže neviem.

Už ma napáda iba možnosť urobiť script, aby v tých statických stránkach slovo po slove ooli urobené odkazy na stránky dynamické.

Summa sumárum mám pocit, že čím sú stránky jednoduchšie, tým je to pre vyhľadávač lepšie, a tým pádom aj pre užívateľa, lebo nájde, čo hľadá (a čo ja ponúkam), kdežto keď sa rozhodnem pre modernejšiu technológiu, som prakticky v p*d*eli, lebo vyhľadávač (a tým pádom ani návštevník) nič nenájde.

A to je tá absurdnosť, nie?
ninja
Profil
peteo: Už Chamurappi vám psal, že žádný rozdíl mezi statickou a dynamickou stránkou z pohledu uživatele (jedno jestli člověk nebo robot vyhledávače) není.

Ve vašem případě je rozdíl v URL, který jste si určil ale pouze vy sám. URL si můžete vytvořit jaké chcete.

Je možné že vyhledávač vyhodnotí vaše nová URL jako jednu stránku s filtrováním/stránkováním a proto je nechce všechny indexovat. Může pomoci změna URL, větší poměr jedinečného obsahu na stránkách. A jako vždy dobré prolinkování.

Ano, opravdu čím stránky jednodušší, tím lépe. Ovšem s technologií to nemá co dělat. Rohlík jde vytvořit ručně nebo v plně automatické pekárně, výsledek bude ale stále rohlík.
Marek Prokop
Profil
[#5] Já myslím, že si nerozumíme terminologicky, takže to zkusím ještě jednou.

Jako dynamické se obvykle označují stránky, které vygeneruje skript na straně serveru (u Vás asi PHP) na základě nějakého vstupu uživatele, obvykle přes formulář. O těchto stránkách se musí vyhledavač nějak dozvědět, aby je mohl stáhnout, a dále musí mít jistotu, že jsou dostatečně unikátní a důležité, aby je zařadil do výsledků hledání. Dozvědět se o nich může různými způsoby, mj. i z XML sitemapy. Do výsledků vyhledávání je zařadí ale zpravidla (řídké výjimky existují) jen tehdy, když na ně existují i klasické odkazy.

Tzv. dynamické weby se tedy správně navrhují ve dvou vrstvách. V první vrstvě musí být každá důležitá stránka dosažitelná pouhým klikáním na klasické HTML odkazy, bez použití formulářů a bez klientských skriptů (Javascript). Jestli se nakonec stránka generuje serverovým skriptem v PHP, je úplně jedno. Ve druhé vrstvě se pak vytvoří jakákoli další navigace (formuláře, Javascripty, AJAX atd.), která je sice pro roboty nepřístupná, ale uživatelům práci s webem usnadňuje.

Tenhle dvojvrstvý návrh se obvykle považuje za správný postup (best practice) ve webdesignu obecně, nikoli jen kvůli vyhledavačům a SEO. Výjimkou jsou čistě aplikační weby (samotný vyhledavač Google je dobrý příklad), které sami o sobě, bez zadání uživatele, žádné stránky de facto nemají. Je určitě dobře, že chcete využít co nejmodernější technologie, ale musíte počat s tím, že jsou náročnější a jejich použití je vhodné nejprve dobře nastudovat.

Už si rozumíme?
camo
Profil *
Prepáčte, že do toho skáčem, aj mňa to zaujíma, aj keď neviem či nie som vedľa. Myslím, že ide o to, že ak stránka s php zliepa svoj obsah z viacerých textových súborov, či sa robot pri indexovaní dokáže k tým súborom dostať cez php. Ja do toho zatiaľ moc nevidím, tak preto možno taká mimootázka.
ninja
Profil
camo: Vyhledávač se dostane jen k obsahu těch souborů coby společnému obsahu html stránky generované pomocí PHP, nebo i přímo k textovým souborům, bude-li jejich URL veřejně přístupné a někde nalezitelné.
peteo
Profil
ninja:
nebo i přímo k textovým souborům

upresnenie:
žiada vyhľadávač striktne príponu .txt, čoby textové súbory?
mám tieto súbory uložené bez prípony, hoci sú to v podstate texťáky.
čo keď tie súbory uložím s neštandartnou príponou, povedzme .heu (heuréka)?
treba ich nejako deklarovať v sitemap alebo robots.txt?
peteo
Profil
Marek Prokop:V první vrstvě musí být každá důležitá stránka dosažitelná pouhým klikáním na klasické HTML odkazy

Takže nakoniec spejeme k tomu, že skutočne budem musieť vytvoriť nejakú statickú stránku v klasickom html, nejaký index, kde bude tých 100.000 hesiel, aby som získal dynamické odkazy na jednotlivé heslá?

Stále som sa nedozvedel, či vyhľadávač niekde ukladá už vygenerované stránky (do cache).
camo
Profil *
No ja už svoj problém chápem. Ale dík moc za odpoveď.

peteo
upresnenie:
žiada vyhľadávač striktne príponu .txt, čoby textové súbory?


Robotovi je jedno z čoho str. vzniká, on ju skúma ako výsledné html.
Alebo existuje ešte iný prístup robotov ku stránkam?!? A ak hej môžem dostať nejaký link kde je to opísané, ktorý nebude starší ako 2roky?
Chamurappi
Profil
Reaguji na petea:
žiada vyhľadávač striktne príponu .txt, čoby textové súbory?
Ne. Co by z toho uživatel vyhledávače měl?

čo keď tie súbory uložím s neštandartnou príponou, povedzme .heu (heuréka)?
Vyhledávačům je opravdu úplně jedno, jak je stránka na straně serveru sestavovaná. Stejně jako návštěvníkům.

skutočne budem musieť vytvoriť nejakú statickú stránku v klasickom html, nejaký index, kde bude tých 100.000 hesiel
Vyhledávač se ti vybodne na to, aby procházel dlouhý seznam odkazů a navštěvoval každou stránku, stejně jako by se na to vybodl člověk. Musíš najít jiný způsob, jak spolu jednotlivé stránky provázat. Ideálně takový, který bude zajímavý i pro lidi.

Stále som sa nedozvedel, či vyhľadávač niekde ukladá už vygenerované stránky (do cache).
Asi nerozumím otázce. Indexovací robot si samozřejmě zapisuje do indexu, co jiného by dělal…


Reaguji na cama:
Alebo existuje ešte iný prístup robotov ku stránkam?!?
Ne.
peteo
Profil
Chamurappi

Vyhledávač se ti vybodne na to, aby procházel dlouhý seznam odkazů a navštěvoval každou stránku, stejně jako by se na to vybodl člověk. Musíš najít jiný způsob, jak spolu jednotlivé stránky provázat. Ideálně takový, který bude zajímavý i pro lidi.

Je toto jeden zo spôsobov(?):

Odkaz?

Bude si vyhľadávač pamätať túto stránku, keď už raz bola vygenerovaná (takto stojí vlastne celý môj dotaz), uloží ju do cache?.



ja sa vážne ospravedlňujem za svoju nechápavosť, ale u statických stránok som bol vo vyhľadávačoch po zaregistrovaní do týždňa, a pri heureke stále (po) mesiaci nič, jedine s-rank 10.

ešte poddotaz: keď teda dám do sitemap tie textové súbory, z ktorých sa vlastne stránky skladajú, bude ich teda vyhľadávač brať v potaz? (ešte raz sa ospravedlňujem)
Bez ohľadu na príponu (aj keď sú bez prípony?).
ninja
Profil
peteo: Odkazovanou stránku si vyhledávač do cache uložit může, ale nemusí.

Problém vašich stránek je myslím v nevhodné struktuře URL. Vyhledávače pravděpodobně vyhodnocují parametr dotaz jako nějaký filtr jinak stejné stránky. Zkuste si něco nastudovat o "Cool URL".

Pokud nabídnete i textovou alternativu k vašim stránkám, tipuji že ji budou vyhledávače preferovat. Protože bude pravděpodobne přehlednejší, rychleji se načítající a bez těch nesmyslů všude okolo.
shaggy
Profil
Problém vašich stránek je myslím v nevhodné struktuře URL. Vyhledávače pravděpodobně vyhodnocují parametr dotaz jako nějaký filtr jinak stejné stránky. Zkuste si něco nastudovat o "Cool URL".
Jeho problém nie je v tvare URL adries, tie spomínané Cool URL sú hlavne pre ľudí.
Radšej by sa mal sám seba opýtať otázku - má vyhľadávač dôvod indexovať môj web a všetky stránky na ňom? Prečo by sa mal "zaoberať" webom, na ktorý vedie minimum (skoro žiadne) spätných odkazov, ktorý má duplicitný obsah (zbežným prezretím mi to pripomína ten prvý web). Keď už sme pri tom, ako sa má vyhľadávač (a ľudia, ktorí by chceli na tie stránky odkazovať) dozvedieť, že existujú iné stránky, než úvodná? Prelinkovanie žiadne, obsah mätúci - ja som napríklad nepochopil, ako sa dostanem k nejakému záznamu, preto na tú stránku nemôžem ani odkazovať a tým pádom nezíska spätné odkazy.

Tvar adries je v tomto prípade ten najmenší problém (ale rady si tu dostal, niektoré sa opakujú, len ty to stále nevieš pochopiť).

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: