Autor Zpráva
ludekbrno
Profil *
Moderátor Davex: Přesunuto z tématu založeného spamovacím robotem

Přesně tento spam mi leze na fórum které spravuji. Přitom mám registraci i vkládání příspěvků neregistrovanými návštěvníky mám chráněné captchou, kterou přečtu sotva já sám, takže přečtení robotem nehrozí. Jak se to do fóra může dostat? Že by někde seděl barák číňanů, kteří vkládají spam na fóra chránéné proti robotům? Jinak si to neumím vysvětlit. Chodí mi jich tak 10 denně.
Ivy
Profil
Někde jsem četla že ručně to dělají indové. Některé spamovací kombajny captchu už poměrně delší dobu umí. Zkus napadené vlákno dočasně zamknout, někdy to pomůže. Mimochodem vytahování vlákna je často přiláká.
LudekBrno
Profil
Ivy:
Bohužel dokonce si zakládají vlastní vlákna :-) A je to přesně tento formát, nadpis + jakési nesmyslné číslo. Používám takovou captchu, kterou opravdu sotva přečtu sám, nechce se mi věřit, že by to zvládal robot :-) Spíš už věřím tomu, že někde sedí barák plný levných pracovníků, kteří mají seznam nalezených diskuzních fór a přes CTRL + V to sypou jedno za druhým. I když v tom fóru mám zapnuté schvalování příspěvků moderátorem, takže do fóra se to viditelně nikdy nedostalo. Je docela zvláštní, že by plýtvali úsilím pracovníků a ani nezkontrolují, jestli se to vůbec ve fóru objeví.
Petr ZZZ
Profil
„Je docela zvláštní, že by plýtvali úsilím pracovníků a ani nezkontrolují, jestli se to vůbec ve fóru objeví. “
Možná netuší, že všechny příspěvky jsou povolovány ručně a předpokládají odchycení spamu automatem, který se pak snaží obejít pořád nanovo. Nebo to tam opravdu – kapča, nekapča – sype automat.
Ivy
Profil
LudekBrno:
nechce se mi věřit, že by to zvládal robot
Jseš naivní, kombajny captchu už několik let umí. Časem pracovníků neplýtvají, tyhle kombajny to sypou rychlostí několik set příspěvků za minutu, takže ani na polovině smazaných nezáleží. CTRL+V se dává jenom na začátku, harvester to pak sype automaticky. Předtím si vyhledá nejnavštěvovanější stránky na zvolené klíčové slovo, seřadí je podle pageranku, provede registraci, automaticky ji potvrdí, přihlásí se, vyhledá zda je odkaz follow nebo nofollow... Zkus si zadat na Youtube klíčová slova harvester, Scrapebox nebo X-rumer a počti si jak se dneska dělá blackhatSEO. A takové programy se dají sehnat i free.
Ivy
Profil
Toto nové vlákno vzniklé díky spamu je výborný námět pro lidi na tomto fóru, kteří hledají nějaký projekt. Každou chvíli se zde objeví výkřiky typu: O čem mám udělat stránku nebo co mám naprogramovat. Pokud by se našel někdo, kdo by naprogramoval antiharvester, tedy program na obranu proti komentářovému spamu, jistě by ho velebila spousta nešťastných administrátorů zájmových fór kteří většinou nemají čas ani moderátory na hlídání fóra 24 hodin denně. Hádám že by si na tomhle mohl i udělat jméno, mám za to že by se takový program mohl virálně šířit.
Pokud by se někdo našel mám i jakousi představu co všechno by to mělo umět.
user243
Profil
mně se osvědčilo řešení odtud z fóra, kde se ve formuláři bude :
<div style="visibility:hidden;">
 <input type="text" name="name" value="">
</div>
obyčejného člověka to nijak neotravuje a bot se mi zatím přes to nedostal, i když to podle logu zkouší cca každý druhý den;
jenikkozak
Profil
Ivy:
Hádám že by si na tomhle mohl i udělat jméno, mám za to že by se takový program mohl virálně šířit.
Čím větší popularitu by to řešení mělo, tím víc by se programátoři spamovacích robotů snažili, aby ho obešli. Nemůžeš se dostat do stavu, kdy si budeš moci říct, že jsi vyřídila veškerý spam. Protistrana trochu zapracuje a všechno začíná od začátku.
LudekBrno
Profil
Ivy:
Tuší někdo, Jak to funguje technicky? Je to na principu OCR a opravdu luští z obrázku ten text nebo to využívá nějaké chyby diskuzí a captchu obchází? Vážně se mi nechce moc věřit, že by program přečetl z obrázku něco, co má problém problém přečíst človék :-)
nevimco2
Profil
Něco takovýho jsme psali na škole. Spočívá to v tom že, si robot natahne databázi neobvyklích fontů, a pak porovnává který z nejvíce pasuje k danné captche. Potom si vesme abecedu + čísla a zase porovnáná. Pak zkusí odeslat request. Pokud to výjde - může začít "pracovat", protože většina webů nemění písmo. Pokud to nevýjde, odešle ještě pár zoufalých requestů, a jde zkusit jiné písmo.

Tímto způsobem se nám asi za hodinu psaní kódu a deset vteřin běhu programu podařilo obelhat captchu na seznamu (ale už to je pár let, věřím že ochranu posílil nejen seznam ;-)).
weroro
Profil
Teraz ma tu možno ukameňujete, ale ak vynecháme pomerne ošemetnú podporu rozširujúcich technológií (napr. Flash), nebolo by riešením urobiť captchu pomocou flashu?
LudekBrno
Profil
weroro:
To by sice bylo asi docela funkční, jenže by se web stal nepoužitelným pro uživatele bez flashe. A těch je poslední dobou poměrně hodně, zejména na mobilech.


nevimco2:
Díky za vysvětlení, už tomu začínám věřit :-)
Chamurappi
Profil
Na této diskusi je člověk bez JS požádán, aby napsal určité číslo. Člověkovi s JS se napíše samo a skryje se. Pro drtivou většinu diskutérů je taková kontrola neviditelná a spamboti se tím běžně neprokousávají, nejsou na to cíleni. Jen teď v ten pátek se jim povedlo v rámci mnoha tisíc pokusů dané číslo párkrát uhodnout (je konstantní). Jakmile Str4wberry číslo změnil, je zase po spamu.


Reaguji na LudekBrna:
Vážně se mi nechce moc věřit, že by program přečetl z obrázku něco, co má problém problém přečíst človék :-)
Strojově generovaná data můžou být lépe čitelná strojově než lidsky. To mi nepřipadá moc překvapivé.

Před pár lety napsal DoubleThink článek o generování 3D CAPTCHA obrázků, u kterých nikdo (krom spammerů) nemá motivaci investovat do vývoje OCR. Bohužel svůj blog už zrušil, text i s kusem zdrojáku generátoru je ve WebArchivu, obrázky se nedochovaly.
Edit po třech letech: Už existuje nová verze toho článku.
Ivy
Profil
LudekBrno:
Jak to funguje technicky
Tak si ten program stáhni a pohrab se v něm. Já nevím jak to funguje technicky, vím jak to funguje prakticky.
Jako ochranu proti spamu na fóru používám administrátorem schvalovanou registraci, kdy každého registrovaného ručně prověřuji. Některým se registrace podaří, ale já je odhalím a nepovolím. A to předtím ještě musí projít přes ochranu vlastní pole v profilu (mám phpBB), a i přes ní procházejí profláknutí pákistánští spameři. A to mám poměrně vymyšlenou otázku, něco jako napiš v prvním pádě jméno Vaška Klause a ještě je tam jedno pole s dalším chytákem. Navíc je tam ještě šílená captcha. Tohle vážně nevím jak procházejí.
Prověřovat každého registrovaného je docela časově náročné, kdyby tohle mohl dělat program bylo by to fajn. Ještě je tam jeden zádrhel, spameři typu lenicka1313 pracují poloručně, nejspíš se Scrapeboxem a pro ty tohle obejít zas tak velký problém není.
Ivy
Profil
Chamurappi:
spamboti se tím běžně neprokousávají
Ještě mám nějaké otázky: Jak dlouho to zde funguje a co znamená běžně - za jak dlouho to prostřelí?
Chamurappi
Profil
Reaguji na Ivy:
• Antispam sem Yuhů nasadil 4. června 2006, tenkrát se ptal na číslo čtyři.
• Dne 27. září 2008 jsme číslo změnili na dvacet čtyři. Tuším, že po delší době, kdy se botům postupně dařilo trefovat častěji, ale ne příliš často (nešlo o pohotovostní úpravu, zřejmě trvalo i delší dobu, než se nasadila).
• A naposledy teď v pátek 16. listopadu 2012 nás náhlý příval spamu donutil dát tam v 19 hodin dvě stě čtyřicet pět.
Davex
Profil
Ivy:
4.6.2006 Zaveden antispam pro vkládání příspěvků s číslicí 4 (pro miniBB je to popsáno spam ochrana v miniBB)
30.12.2008 Registrační formulář ošetřen antispamem a změna čísla na 24.
16.11.2012 Spambot uhádl tu čtyřiadvacítku.

Průměrně je to tedy účinné tak 3 roky.
Ivy
Profil
Díky, podívám se na to.
Stejně mi ale není jasné proč to tady funguje a u mě ne. Druhé pole v profilu mám také číslici, trojmístnou a v políčku je jiná předvyplněná. Je to tím javascriptem?
Ten odkazovaný kód je možno použít? Nebude to pokládáno za kopírování?
EDIT: Tak jsem ještě trochu zapátrala, xrumer má novou verzi a šmejdi si jí velmi pochvalují. Asi se máme na co těšit.

Vaše odpověď

Mohlo by se hodit

Kategorie Obsah webu se věnuje otázkám:
  • autorského práva,
  • o čem a jak psát,
  • sociálních sítí.

Upozorňujeme, že názory ajťáků a právníků se mohou dost lišit. Počítejte s tím, že na této diskusi jsou inteligentní lidé s obecným právním rozhledem, můžou vám poradit dle svého nejlepšího vědomí a svědomí, ale nemůžou poskytnout žádnou garanci, že neskončíte za mřížemi. Na opravdové konzultace si pořiďte opravdového právníka.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: