Autor Zpráva
HasbO
Profil *
Dobrý den,
chtěl bys se zeptat, jeslti jde udělat nějaký sript na to, aby mi z webu firmy.cz tahal a ukládal e-mailové adresy u firem z kategorie AutoMoto, které nebudou mít zadanou adresu na své webové stránky.
Já jsem hledal nějakou php funkci, která by uměla spolupracovat s webovými stránkami a ukládat data, které bych si navolil, ale žádný jsem nenašel..
Děkuji za odpověď.
Trejpa
Profil
HasbO:
Vytěžování cizí databáze je protizákonné. Cokoliv protizákonné je proti pravidlům.
Ugo
Profil
není to problém napsat, problém je, že už zavedli ochranu proti tomuto vytahování dat a tudíž tě stopnou, případně bys musel zkusit tahat hodně pomalu, další problém je že si nejsem úplně jist legalitou toho počinu (a proto nebudu nabízet ani svůj hotový script který bych ještě asi někde možná vyhrabal.. a stažená data už tuplem ne :-P). Další problém v tom co chceš je, že nabízet bez souhlasu nabídku taky není košér a dával bych si na to pozor protože hodně lidí sou jednoduše hákliví práskači ze staré doby (také vlastní zkušenost). Raději se na to vykašli, může ti to nadělat solidní trable (já to dělal na příkaz šéfa a měl sem sakra v kalhotách - ještě aby ne když by to byl muj průser :-/ )
HasbO
Profil
Aha, tak jen jestli byste byli ochotní mi sem napsat alespoň nějaký web, kde se touto problematikou zabývají, nebo alespoň jak vypadá základní funkce, o které bych se mohl dozvědět více.
Trejpa
Profil
HasbO:
Jen jestli byste byli ochotní mi sem napsat … kde se touto problematikou zabývají
Zákon 121/2000 Sb. (§ 90, 5. odstavec).
HasbO
Profil
Trejpa:
Ok, můžete lock.

Děkuji za odpovědi, alespoň jsem se něco dozvěděl :)
Str4wberry
Profil
Neřekl bych, že je to v každém případě protizákonné. Záleží na způsobu užití.
Borius
Profil
Nevidím v tom nic nelegálního. Chce si pouze shromáždit e-mailové adresy určitých firem z veřejně dostupného katalogu stránek. To je podle mne zcela legitimní požadavek.
Trejpa
Profil
Str4wberry:
Záleží také na tom, zda nebude samotným stahováním poškozovat majitele databáze.

Nezdá se mi, že by byly zákonné možnosti využití vykradené databáze podnětem k vytvoření takového programu. Přiznejme si, že hlavním důvodem vzniku stahovače je šíření spamu nebo prodej získaných informací ke stejnému účelu.
ninja
Profil
Borius: Trejpa vám radiz zcela správně, váš záměr je jistě neoprávněné vytěžování cizí databáze. Jendá se ale o občanskoprávní problematiku, tudíž dokud Vás provozatel webu (Seznam.cz) nebude žalovat, jste relativně v klidu. Daleko pravděpodobnější je že vám jen zablokují přístup.

Web Firmy.cz není provozován proto, aby si někdo stahoval hromadně kontaktní údaje a dále je zpracovával. Má sloužit pro individuální vyhledávání firem a jejich kontaktování.

Další otázka je co chcete po nasbírání emailových adres dělat - rozesílat spam? Tam už hrozí správní sankce.
HasbO
Profil
Tak bych se tedy chtěl zeptat, jaký je script na stahování např. vybraných obrázků z galerie, abych nemusel manuálně stahovat třeba 1000 obrázků, ale aby se mi stáhli automaticky spuštěním programu.
Děkuji za odpvědi
Str4wberry
Profil
Skript je na to takový, že si projde vybrané stránky a na každé si vyzobe adresu z <img src> a její cíl se pokusí uložit.
Borius
Profil
ninja:
co chcete po nasbírání emailových adres dělat - rozesílat spam?
Nechci sbírat žádné e-mailové adresy. Patrně jste si mě spletl s tazatelem. Já jen odpovídal.

Řekl bych, že protiprávní je to pouze za jistých podmínek. Jednak by musel způsobit škodu společnosti Seznam.cz, dále by se musel přímo nabourat do databáze (doslova ji vytěžovat) a také by to musel činit soustavně. Ty tři body by musel porušit, aby se jednalo o porušení [#5] zmíněného zákona.
_es
Profil
Borius:
by se musel přímo nabourat do databáze (doslova ji vytěžovat)
Ja skôr pod českým slovesom „vytěžovat“ v tejto súvislosti rozumiem jej nadmerné zaťažovanie, napríklad nadmerným počtom dotazov či nadmerným ťahaním dát z nej. Pod databázou nie sú v tejto súvislosti asi myslené len samotné dáta ale aj celý softvér nad nimi postavený.

Jednak by musel způsobit škodu společnosti Seznam.cz
Nemusel, ale bola by to priťažujúca okolnosť. Škodu spôsobuje aj nadmerné zaťažovanie serverov - tie nejdú zadarmo.

také by to musel činit soustavně
No ale z dotazu vyplýva, že by to sústavne bolo.
Borius
Profil
_es:
* Pochybuji, že by takový server dokázal nadměrně zatížit jediný bot. Ostatně musí zvládat nápory desítek až stovek jiných indexovacích strojů. Ty také „sosají“, zpracovávají, uchovávají a využívají data z veřejně přístupných serverů. Tedy i z ‘Firmy.cz’.

* Způsobení škody – právě to je podstatou toho zákona, proto vznikl.
Například denně mívám přehršel dotazů na Googlu, ale nemyslím si, že je to špatné. Google byl vytvořen, aby poskytoval informace. Obdobně jako Firmy.cz. Přišlo by mi divné, kdyby někoho žalovali, že vyhledává na jejich serveru informace, které poskytují. Nebo že je nadměrně vyhledává…

* Máš pravdu – soustavně by to nejspíš bylo.
Trejpa
Profil
Borius:
Přišlo by mi divné, kdyby někoho žalovali, že vyhledává na jejich serveru informace, které poskytují.
Přišlo by mi divné, kdyby nežalovali někoho, kdo si na takto získaných informacích staví svůj byznys.


Na českém internetu se pohybuje několik rádoby katalogů firem, jejichž autoři vytěžili data z firmy.cz a profitují na reklamách. Vtipné je, že získaná data využívají i s chybami, jejichž odstranění na firmy.cz se už do jejich katalogu nepromítne.
ninja
Profil
Borius: Omlouvám, spletl jsem si Vás s původním tazatelem.

Řekl bych, že protiprávní je to pouze za jistých podmínek. Jednak by musel způsobit škodu společnosti Seznam.cz, dále by se musel přímo nabourat do databáze (doslova ji vytěžovat) a také by to musel činit soustavně. Ty tři body by musel porušit, aby se jednalo o porušení [#5] zmíněného zákona.

Bohužel se naprosto pletete. Prosím přečtětě si paragraf 90 a následující autorského zákona.

1. Škodu, respektive újmu Seznamu způsobíte, protože jej přípravíte o možný zisk z takto prodaných údajů, které byste jinak od něj zakoupil.
2. Co znamená vytežování databáze je stanoveno v zákoně. Rozhodně není nutné se někam nabourávat - jak jste na to přišel?
3. Nemusí jít o soustavné vytěžování, ale opakované. Což bude splněno, pokud se nestáhne vše jedním requestem.
Borius
Profil
ninja:
Děkuji za odkaz, četl jsem a – mýlil jsem se v tom nejzákladnějším, tedy co je databáze. Znění zákona mě velice silně překvapilo, co považuje za databázi. Do té definice se vejde ledacos: většina knížek, telefonní seznam v mobilu, lístek s nákupem, většina webových stránek jako takových, diář i osobní poznámky, uspořádané soubory a složky v počítači (či mobilu), žákovská knížka, dopis Ježíškovi…
Dokonce i prádlo na šňůře, pokud je nějakým způsobem uspořádané (to je takřka vždycky).
Ta zákonem velice zevrubná definice databáze, mě zkrátka překvapila.
§88 Autorského zákona: „Databází je pro účely tohoto zákona soubor nezávislých děl, údajů nebo jiných prvků, systematicky nebo metodicky uspořádaných a individuálně přístupných elektronickými nebo jinými prostředky, bez ohledu na formu jejich vyjádření.“
Tam se opravdu vejde snad cokoli:)
Až do této chvíle jsem žil v domnění, že databáze je uspořádaná soustava informací nebo dat, mající vnitřní strukturu…

Vaše odpověď

Mohlo by se hodit

Kategorie Obsah webu se věnuje otázkám:
  • autorského práva,
  • o čem a jak psát,
  • sociálních sítí.

Upozorňujeme, že názory ajťáků a právníků se mohou dost lišit. Počítejte s tím, že na této diskusi jsou inteligentní lidé s obecným právním rozhledem, můžou vám poradit dle svého nejlepšího vědomí a svědomí, ale nemůžou poskytnout žádnou garanci, že neskončíte za mřížemi. Na opravdové konzultace si pořiďte opravdového právníka.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: