Autor Zpráva
Pítrs
Profil *
Tenhle dotaz neni o tvorbě webu ale webu se týká. Tak se to pokusím popsat

1. Lze nějakým způsobem prohlížet cizí web jako kdybych byl připojen přes FTP...resp. viděl bych všechny složky a soubory..?

2. Lze nějakým způsobem stáhnout (volně dostupné data) z webové databáze?

Jde mi o to, že např. www.bandzone.cz je X tisíc kapel, X tisíc fanoušků, kteří zde mají své profily. Chtěl bych nějakým vhodným způsobem si stáhnout informace (at už se jedná o věk, pohlaví, vazby na další uživatele, kontakty) o uživatelých a analyzovat je.
Na stránce pochopitelně je abecední seznam kapel / fanoušků. K získání informací o uživatelích je ale nutné rozkliknout každý profil zvlášť....zajímalo by mě, zda není nějaký jiný způsob.

Může se zdát, že mám neblahé úmysly, jako např. hromadné rozesílání spamů atd....nicméně jedná se pouze o statistiku k mé práci.

Předem děkuji za jakékoliv postřehy.
Str4wberry
Profil
Ad 1) Takové weby zpravidla nemají stránky rozloženy do souborů a složek, ale jsou v databázi.
Ad 2) Ke stažení celých stránek existují různé programy, ale není nutné si stránky fyzicky stahovat na disk, ta data můžeš zpracovat přímo z webu.

Zkrátka sběr informací proběhne ve dvou fázích. V první získáš všechna jména uživatelů ze všech stran, ve fázi dvě si vyzobeš informace z http://bandzone.cz/fan/jméno.

Jinak často lze informace pohodlněji vytěžovat z RSS, mapy webu nebo mají přímo API vracející data ve strojově čitelném formátu, ale to není zjevně tento případ.
ninja
Profil
Pítrs: Doplnil bych že z právní stránky je plánovaná činnnost problematická. Budete neoprávněně vytěžovat cizí databázi, což je nelegální (viz Hlava III. Autorského zákona).
Pítrs
Profil *
Děkuji za moc za vaše rady.

Str4wberry: Použití programu pro stažení stránek se mi zdá rozumný, ale na druhou stranu varianta zpracovávat data přímo z webu by se mi zamlouvalo víc. To je možný taky za pomocí nějakého programu?

ninja: Děkuju za upozrnění :-)
Str4wberry
Profil
Těžko bude nějaký program přímo určený ke stahování dat z Bandzone. Mohl by existovat program, který by vytáhl určitá data z webu na základě regulárního výrazu. Případně si něco takového může napsat člověk sám.

Ještě je tu možnost se dotázat přímo provozovatele.

Vaše odpověď

Mohlo by se hodit

Kategorie Obsah webu se věnuje otázkám:
  • autorského práva,
  • o čem a jak psát,
  • sociálních sítí.

Upozorňujeme, že názory ajťáků a právníků se mohou dost lišit. Počítejte s tím, že na této diskusi jsou inteligentní lidé s obecným právním rozhledem, můžou vám poradit dle svého nejlepšího vědomí a svědomí, ale nemůžou poskytnout žádnou garanci, že neskončíte za mřížemi. Na opravdové konzultace si pořiďte opravdového právníka.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: