« 1 2 3 4 »
Autor Zpráva
jenikkozak
Profil
janbarasek:
Kdo nechcete, aby můj robot stahoval vaše weby, dejte ban na tuto IP: 90.180.123.164
Není mou povinností blokovat tvou adresu. Není tvým právem porušovat má práva. Už chápeš? Kvůli tvému robotovi nebudu (a celý svět se mnou) dělat nějaké filtrování adres.
janbarasek
Profil
WWWeee:
Já mám archiv. Obsah archivů nijak neupravuji a hledím na autorské práva.

Zítra vydám kontrolu. Kdo enbdue chtít mít zaindexovaný web, nechť vytvoří soubor baraja.html a v jeho obsahu slovo "archiv". Zítra toto naprogramuji a toto je myslím dostatečné zabezpečení proti archivů. Ne?
Stano
Profil *
janbarasek:
A to ja mám prehľadávať web nato aby som zabanoval všetky podobné IPcky? Prečo nepostupuješ tak ako každý slušný človek a autorov sa dopredu nespýtaš či si želajú okopírovať celý web.... a weby ktorých autor ti nedá súhlas jednoducho nemôžeš kopírovať.
MatějŠ
Profil
janbarasek:
Postupuješ strašně špatně a pokud to nezměníš tak tě v budoucnu můžou čekat i problémy. Vůbec bych se nedivil.

Pokud už opravdu musíš weby archivovat tak to udělej obráceně a archivuj jen ty weby, které ti řeknou že chcou od tebe archivaci. Jinak ne.
Medvídek
Profil
janbarasek:
Udělej to obráceně. Kdo chce mít svůj web indexovanej, ať si vloží ten soubor.
jenikkozak
Profil
janbarasek:
Zítra vydám kontrolu. Kdo enbdue chtít mít zaindexovaný web, nechť vytvoří soubor baraja.html a v jeho obsahu slovo "archiv". Zítra toto naprogramuji a toto je myslím dostatečné zabezpečení proti archivů. Ne?
Asi tomu moc nerozumíš. Zítra si založ na svém webu v kořenovém adresáři soubor nechci_dostat_pres_pusu.html s obsahem „nechci dostat“, v opačném případě ti může kdokoliv dát pár facek. (A bacha na to, že abys tomu zabránil, asi budeš muset použít více různých souborů, podle toho, co si kdo bude přát.)
joe
Profil
jenikkozak:
Autoři webu se třesou, aby k nim Googlebot přišel, prosí jej o návštěvu.
To ale neznamená, že by měl Google archivovat weby. Nepsal jsem o indexaci, ale o archivaci - tj. o odkazu "archiv" na stránce s výsledky hledání.

To samé by se dalo napsat o stránce web.archive.org, kde také archivují weby. Oni to snad mají povolené?
yFang
Profil
janbarasek:
Kdo nechcete, aby můj robot stahoval vaše weby, dejte ban na tuto IP: 90.180.123.164.
Proč to prostě neuděláš jen pro ty, co to chtějí, když je to tak "výhodné"?
janbarasek
Profil
Já tu budu dělat tak, že robot bude normálně stahovat weby (bez limitu). ty budoui normálně přístupný v mim počítači (nikde jinde). Pokud někdo bude chtít archiv veřejně, ať vytvoří soubor a nebo ať mi napíše (typický příklad blogů). Co vy na to?

Ještě taková odbočka.. co web.archive.org? Těm je úplně jedno, že maji tolik obsahu, že se rovnaji menší továrně a jedou fakt ve velkym?

A nevim, co vám vadí na tom, že váš web zaarchivuji..
joe
Profil
MatějŠ, Medvídek, yFang:
Proč to tak nemá Google? Proč to tak nemá web.archive.org? Stěžujete si někdo na to?
WWWeee
Profil *
janbarasek: "Obsah archivů nijak neupravuji"

To přece nehrá roli.

janbarasek: "hledím na autorské práva"

Jak?

janbarasek: "Kdo nebude chtít mít zaindexovaný web, nechť vytvoří soubor baraja.html"

To snad ne. Autorská práva a jejich ochrana jsou chráněna zákony a soubor "baraja.html" je tedy zbytečný nesmysl. Nebudu zítra volat programátorovi aby mi do eshopu vložil nějaký soubor. To spíše zavolám právnikovi když najdu svůj webový obsah na baraja.cz. Nashle.
Krakatoa
Profil
Psal jsem mu, aby se to dělalo přes kontrolu v robots:
User-agent: Baraja
Disallow: /

S tím, že by to bloklo i celou historii.

Je mi jasné, že je to nejspíš nelegální, takový archiv dělat, ale mně nepřijde, že by zatím dělal nějaké problémy webům, které tam jsou.
A když vidím, jak to Baráška baví...
MatějŠ
Profil
joe:
Proč to tak nemá Google? Proč to tak nemá web.archive.org? Stěžujete si někdo na to?
Až se jeho web bude rovnat googlu, tak ať si můj web klidně vyryje do kamene na věky věků.
Marek Prokop
Profil
Srovnání s Googlem moc nesedí. Ten má jednak velmi transparentní a jednoduchý mechanismus, jak archivaci zabránit a jednak má armádu dobře placených právníků a peníze na pokuty resp. náhrady škody, ke kterým byl už několikrát různými soudy odsouzen. Doporučuji proto Janu Baráškovi, ať svůj archiv dále provozuje za předpokladu, že:

1) poskytne podobně jednoduchý opt-out a odkáže na něj z každé stránky archivu,

2) má naspořeno aspoň pár desítek milionů na případné právní následky.

Pokud něco z toho neudělá či nemá, připadá mi další provozování archivu velmi nerozvážné.
joe
Profil
MatějŠ:
Takže omlouváš společnost Google za to, že archivuje nelegálně, ale tenhle webový archiv se ti nelíbí, i když dělá úplně to samé? To je trochu zvláštní. Proč nemáš na věci stejný metr? Z mého pohledu se jedná o úplně totožné archivy. Ptá se snad Google někoho, zda může archivovat nějaký web? Ne.

Marek Prokop:
jednoduchý mechanismus, jak archivaci zabránit
Ano, ale mělo by to být také naopak.

a jednak má armádu dobře placených právníků a peníze na pokuty resp. náhrady škody
Tady je hezky vidět, kde žijeme. Kdo má peníze, může vše. Takový přístup se mi moc nelíbí, i když my s tím těžko něco zmůžeme. Mělo by to být stejné? Je to nelegální? Pokud ano, tak ať to nedělá nikdo.
Krakatoa
Profil
Marek Prokop:
Já Bráráška trošku znám přes ICQ, myslíš, že todle by stačilo na ten bod 1)?
User-agent: Baraja
Disallow: /

Co se týče bodu 2), nejspíš tu dá zítra číslo konta a udělá sbírku, třeba se k té částce aspoň trošku přiblíží.

MatějŠ:
"Až se jeho web bude rovnat googlu, tak ať si můj web klidně vyryje do kamene na věky věků."
Tudíš neřešíš legálnost / nelegálnost, ale přínos pro tvůj web (myslím, že přínos by teď byl, no jak to napsat, "neutrální") a nejspíš špatný pocit, že kopie tvého webu by ležela i někde jinde.
MatějŠ
Profil
Krakatoa, joe:
Možná je to dvojí metr, ale googl mi přináší zákazníky, Braráškův web nikdy nebude.
Jinak to nádherně shrnul Marek Prokop
Marek Prokop
Profil
joe:
Je to nelegální? Pokud ano, tak ať to nedělá nikdo.

Právo je na internetu často sporné mj. proto, že je Web globální a zákony či soudní praxe různých zemí jsou různé. Kdo chce, může si ty případy Googlu dohledat. Některé soudy (Francie, Belgie) ho odsoudily, jiné (v USA) ne, případně došlo k mimosoudní dohodě.

V kontextu tohoto vlákna mi ale připadá Google bezpředmětný. Tady se ptá Jan Barášek a ten nesporně vyjednávací, právní a finanční sílu Googlu nemá, takže není o čem diskutovat.
Stano
Profil *
joe:
google v prvom rade len presmeruje na tvoj web. a ak si necháš zobraziť archív tak ta dosť výrazne upozorňuje že to nieje skutočná stránka. http://webcache.googleusercontent.com/search?q=cache:-qeMhApQXnkJ:www.sme.sk/+sme&cd=1&hl=sk&ct=clnk&gl=sk&source=www.google.sk

tento archív čisto skopíruje stránku a nikde ani slovo o tom kde je originálny web.
Marek Prokop
Profil
Krakatoa:
myslíš, že todle by stačilo na ten bod 1)?
User-agent: Baraja
Disallow: /

Nestačilo. O tom by se dozvědělo jen pár účastníků této diskuse a ne každý postižený. Navíc robots.txt standardně nefunguje zpětně na to, co už bylo staženo (i když by si v tom mohl Jan Barášek ten standard upravit).

Nicméně to právní následky stejně neřeší. V Googlu ta možnost je taky (nejen přes robots.txt, ale i přes meta noarchive), a přesto byl za archivování několikrát odsouzen.
Krakatoa
Profil
Marek Prokop:
Já to myslel jako technicky. S tím, že by postup byl třeba na každé té stránce archivu, popř. by se posílal na kontakt, pokud by na webu stránky byl.
Co se týče historie, po zakázání by se nezobrazovala.

Je mi jasné, že právní následky to neřeší, já jen chci minimalizovat možnost vzniku takových právních následků. Myslím, že návrhem zrušit archiv na baraja.cz u Baráška neuspějeme.

"V Googlu ta možnost je taky (nejen přes robots.txt, ale i přes meta noarchive), a přesto byl za archivování několikrát odsouzen."
No google má peníze, Barášek má počítač, černou kočku a sestru, co mu vaří čaj, a to je myslím vše, kdo by se s ním soudil?
Zapomněl jsem na kolo, s ním momentálně jezdí po svém rodném městě a natáčí ulice (skrz další projekt na baraja.cz, snad to není tajné...).
Medvídek
Profil
Krakatoa:
a natáčí ulice
Pokud ví, jaký problémy má Google Street Views :D
Marek Prokop
Profil
Krakatoa:
Co se týče historie, po zakázání by se nezobrazovala.

Jasně, jenže k tomu je robots.txt ze své podstaty dost nevhodný nástroj. Co když robot už na daný web nikdy znovu nepřijde, a tudíž se nedozví, že byl robotos.txt změněn? Proto se zákaz v robots.txt obvykle chápe jen jako zákaz stahování, nikoli zpracování již dříve (před zákazem) stažených dat.
Krakatoa
Profil
Marek Prokop:
Aha, to mě nenapadlo. Takže si bude muset často načítat robots.txt webů v archivu a taky přidat nějaký formulář pro okamžité znovunačtení robots.txt.

Medvídek:
"Pokud ví, jaký problémy má Google Street Views"
Jestli myslíš obličeje, poznávací značky aut atd. tak na řešení těchto problémů má zatím dost času, momentálně, aspoň podle toho vzorového videa (z něj se budou dělat obrázky a ty pak skládat), co mi ukazoval, má jiné problémy: dát přednost v jízdě, nepřiměřená rychlost na kole atd.
Petr ZZZ
Profil
Já když to tady tak čtu (černá kočka, kolo, čajíček...), tak bych měl sto chutí říct "držím tomu rošťákovi palce". Jenže to nejde. Ať už je jeho nadšení sympatické nebo jeho drzost pobuřující, máme tu autory a máme tu zákony, které práva autorů chrání. Co se týče všelijakých těch možností zakázat archivování svého webu přes robots.txt nebo meta tag, to všechno neřeší jeden zásadní problém: Co když autor webu vůbec netuší, že nějaký baraja existuje a nepozorovaně mu archivuje web? Až se to dozví, může být jeho web třeba dva roky archivovaný. Potom začne přemýšlet, jestli se mu to líbí, dojde k závěru, že se mu to nelíbí, protože jeho eshop je archivovaný se zastaralými cenami, a začne se soudit, protože zjistí, že mu Barášek pohněval zákazníky veřejnou prezentací staré verze webu. Nebo se někdo prostě jen rozhodne svůj web více veřejně neukazovat a nelíbí se mu, že někdo jiný jeho obsah nadále prezentuje. A v neposlední řadě tu máme duplicitu a nekalou soutěž. Podtrženo-sečteno, řekl bych, že si janbarasek zadělává na pořádné problémy.
janbarasek
Profil
Vyřešil jsem systém, podle kterého budu archivy zveřejňovat. Každého autora stránek se zeptám, zda můžu jeho archiv zveřejnit, pokud dostanu písemný souhlas, tak budou archivy veřejné. Pokud ne, bude se zobrazovat hláška typu: http://www.archive.baraja.cz/search.php?url=http%3A%2F%2Fwww.jakpsatweb.cz

V rámci uschování cených médií robot stahuje bez omezení, ale zveřenuje pouze na souhlas. Je to proto, abych mohl autorovy stránek předvést, v jaké kvalitě jsou jeho zálohy. Neveřejné zálohy jsou k dispozici na mé domací wifi stanici ( Na mojí IP ), a možná jí povolím do učebny v naší škole (Základní škola) v rámci vyučování historie internetu.

Ještě bych se rád vyjádřil k tomu nafocení ulic. Tento projekt jsem po konzultaci s nejmenovaným člověkem ukončil a nehodlám se k němu dále vyjadřovat. Nafocené materiály NEbudou zveřejněny a nechávám si je v bezpečí na svém pevném disku.


Už tedy souhlasíte s tím, jak funguje můj archiv? Už nepřirovnáváte vložení webu ke mě k odložení dítěte do polenice jak zmiňoval jeden čtenář?
Tori
Profil
<mimo-téma>
janbarasek:
odložení dítěte do polenice
Eh, cože? :-o
</mimo-téma>
Petr ZZZ
Profil
Tori:
Do popelnice.
Chamurappi
Profil
Reaguji na Petra ZZZ:
Potom začne přemýšlet, jestli se mu to líbí, dojde k závěru, že se mu to nelíbí, protože jeho eshop je archivovaný se zastaralými cenami, a začne se soudit, protože zjistí, že mu Barášek pohněval zákazníky veřejnou prezentací staré verze webu.
A kdyby bylo z Baráškovy stránky jasně patrné, že je to jen zaarchivovaná verze, skoro jistě to pan žalující prohraje. Autor e-shopu si nemůžu usurpovat věčnou kontrolu nad zveřejněnou informací, nemůže ji už nikdy odzveřejnit. Kdokoliv si mohl staré ceny zapamatovat, opsat si je, vyfotit si je a fotku někde ukázat atd. — to, zda se to majiteli obchodu líbí, je úplně fuk.

Nebo se někdo prostě jen rozhodne svůj web více veřejně neukazovat a nelíbí se mu, že někdo jiný jeho obsah nadále prezentuje.
Když napíšeš článek do papírových novin, také ho už nemůžeš vymazat z historie. Můžeš ho popřít dalším článkem, můžeš ho zaplavit šumem, aby šel hůř najít, ale to je asi tak všechno. To, že na webu máme pod lepší kontrolou aktuální vydání svých novin, nám sice dává více možností, ale na samotné podstatě aktu zveřejnění to nic nemění.
Je moc dobře, že archivy fungují a že uchovávají i to, co si autoři obsahu možná nepřejí, dokonce je mi občas líto, že ten jeden největší nefunguje důkladněji a hlavně že zde nebyl již u prvopočátků webu, protože některé střípky historie jsou nyní nedohledatelné.

Podtrženo-sečteno, řekl bych, že si janbarasek zadělává na pořádné problémy.
Ale nejspíš jen kvůli porušování autorských práv (neoprávněné šíření rozmnoženin, vytěžování databáze atd.).


Reaguji na jenikakozaka:
Autoři webu se třesou, aby k nim Googlebot přišel, prosí jej o návštěvu. Je pro ně užitečný. Zatímco Baráškův web ne.
Prosí jej o zaindexování, aby byli nalezitelní. Neprosí jej o zaarchivování aktuální verze, což ovšem také dělá. Můžou mu to zakázat <meta> značkou.


Reaguji na Marka Prokopa:
Tohle už v ČR dělá Národní knihovna a od každého chce písemný (opravdu písemný, tj. na papíře) souhlas.
… nebo na dotyčném webu veřejně prohlásit, že je obsah šiřitelný pod licencí Creative Commons. Alespoň tak to psali mně v listopadu.
Mimochodem, pokud si dobře vzpomínám, tak u papírových novin existuje naopak cosi jako povinnost posílat několik výtisků každého kusu Národní knihovně.

Prakticky vzato si myslím, že takovéhle malé rybě stačí čekat na explicitní nesouhlas, protože s ním patrně nikdo nezahájí spor přímo žalobou (a kdyby ano, tak nulová snaha o předcházející mimosoudní řešení by při tom soudním žalující straně uškodila). Nespokojený autor mu nejdřív napíše „Smaž mě, nebo soud, bububu!“. Paradoxně je ovšem taková archivační služba ve stádiu malé ryby pramálo užitečná.


Reaguji na janabaraska:
1) Zařiď, aby bylo z archivované stránky zjevné, že jde jen o archivovanou verzi, a doplň k ní odkaz na verzi stávající.
2) Zařiď, aby vyhledávače neindexovaly archivované verze.
3) Pokud ses nechal kolegy vystrašit, zkus z obsahu stránky automaticky vyčíst, pod jakou licencí je šířen a rozhoduj se podle ní. Aspoň si procvičíš regulární výrazy, to se hodí :-)
4) Případné vyžadování písemného souhlasu bude pro tvůj projekt likvidační. Jsou i jiné (jednodušší) způsoby, jak může dát autor webu jednoznačně najevo, že má zájem… ale stejně moc nepočítej s žádnou aktivitou ze strany majitelů webů speciálně pro tvůj archiv.


Reaguji na Tori:
Asi sestra Polednice, která potřebuje explicitní souhlas s odložením dítěte.
janbarasek
Profil
Chamurappi:
Zařiď, aby bylo z archivované stránky zjevné, že jde jen o archivovanou verzi, a doplň k ní odkaz na verzi stávající.
To bude obtížné, jelikož všechny archivy jsou uloženy jako prosté html soubory. Na druhou stranu, pokud je web na adrese archive.baraja.cz/... Tak by průměrnému člověku mohlo dojít, že to je archiv.

Zařiď, aby vyhledávače neindexovaly archivované verze.
Už si hledám vzor pro robots.txt

Případné vyžadování písemného souhlasu bude pro tvůj projekt likvidační. Jsou i jiné (jednodušší) způsoby, jak může dát autor webu jednoznačně najevo, že má zájem… ale stejně moc nepočítej s žádnou aktivitou ze strany majitelů webů speciálně pro tvůj archiv
Nejlepší se to bude dokazovat potvrzením (písemným), třeba přes email nebo instantní komunikátory. Weby budu procházet ručně a autorům budu psát emaily po př. na instantní komunikátory.

zkus z obsahu stránky automaticky vyčíst, pod jakou licencí je šířen
Už na tom pracuji, každopádně všechny archivy ještě před zveřejněním procházím, abych minimalizoval možnost, že zveřejním něco, co tam být nemělo.
« 1 2 3 4 »
Toto téma je uzamčeno. Odpověď nelze zaslat.