Autor Zpráva
gully
Profil
Ahoj všem,

vytvořil jsem guestbook, a jako antispam a zároveň taky trochu jako obrana proti nežádoucím (urážlivým sprostým atp.) příspěvkům jsem do něj implementoval verifikaci přes věřovací kód, který příjde přispěvateli po odeslání příspěvku na email, který při jeho vkládání do guestbooku musí zadat.

Protože nejsem příliš zběhlý ve tvorbě internetových aplikací, tak bych se chtěl zeptat, jestli považujete tento přístup za správný, jestli příliš neobtěžuje uživatele.

Předem díky za vaše názory.
user243
Profil
no, nějaký takový postup jsem viděl u několika registrací, ale abych to musel dělat i u nějaké knihy návštěv..... určitě bych tam nic nenapsal;
jen mi přijde divné

gully:
kód, který příjde přispěvateli po odeslání příspěvku na email, který při jeho vkládání do guestbooku musí zadat.
trochu si to protiřečí, člověk něco napíše a až potom mu dojde mail s kódem, který má někam zadat? to už by bylo lepší, že napíše příspěvek a na mail mu dojde odkaz, na který musí kliknout, aby příspěvek potvrdil;
Sir Tom
Profil
gully:
jestli považujete tento přístup za správný, jestli příliš neobtěžuje uživatele
Přístup to možná správný je, ale mě by to velmi a neskutečně obtěžovalo. Udělej to tak, aby uživatel nemusel potvrzovat, že je robot. Čili přenes zodpovědnost, za správné či nesprávné příspěvky ne na uživatele ale na správce webu.
gully
Profil
To user243:
Myslím, že si to neprotiřečí. Jen je to jiný způsob a o to mi právě v tomto vlákně šlo.

To Sir Tom:
Jenomže to s sebou nese riziko, že nevhodné příspěvky (myšleno jak příspěvky botů, tak neukázněných uživatelů) tam nějakou dobu budou viset.

Ale souhlasím s tím, že to asi budu muset udělat jinak.
Joker
Profil
gully:
Můj názor je, že proti spamu to bude účinné, akorát to „s vaničkou vylije i dítě“, protože to odradí i většinu normálních návštěvníků.
Do knihy návštěv se asi nebudou psát příspěvky, na kterých by dotyčný nějak lpěl, takže v první řadě už dávat někomu svůj e-mail je problém, pak opisovat nějaký kód… podle mě skoro každý raději neodešle ten příspěvek.

Další problém co by se musel vyřešit, když spammer do pole pro e-mail vyplní nějakou (cizí) existující adresu, aby nespamoval sám ten web nějakého nebožáka stovkami potvrzovacích kódů.

Jinak třeba tahle diskuse má neotravný a poměrně účinný antispam.

Jenomže to s sebou nese riziko, že nevhodné příspěvky (myšleno jak příspěvky botů, tak neukázněných uživatelů) tam nějakou dobu budou viset.
Mohou se všechny příspěvky zobrazovat až po potvrzení správcem webu. Nebo jen nějaké „podezřelé“, například jen ty, které obsahují odkazy.
gully
Profil
user243:
> gully:
> „kód, který příjde přispěvateli po odeslání příspěvku na email, který při jeho vkládání do guestbooku musí zadat.“
> trochu si to protiřečí, člověk něco napíše a až potom mu dojde mail s kódem, který má někam zadat? to už by bylo lepší, že napíše příspěvek a na mail mu dojde odkaz, na který musí kliknout, aby příspěvek potvrdil;
Omlouvám se, špatně jsem si ten příspěvek přečetl, kódem je myšlený hypertextový odkaz ve formě toho kódu, na který stačí jen kliknout, čímž se uživatel dostane do guestbooku, který mu vypíše, že příspěvek byl ověřen a přesměruje jej do guestbooku, kde už je daný příspěvek zobrazený.

Joker:
Další problém co by se musel vyřešit, když spammer do pole pro e-mail vyplní nějakou (cizí) existující adresu, aby nespamoval sám ten web nějakého nebožáka stovkami potvrzovacích kódů.
Ano, tohle jsem si uvědomil už když jsem ten guestbook psal, zatím se ale nic takového v databázi neobjevilo. V případě, že zjistím, že to tak je, udělal bych to asi tak, že bych kontroloval poslední příspěvek pro danou e-mailovou adresu a pokud by tento příspěvek existoval a byl nepotvrzený, neodesílal bych žádný ověřovací e-mail a uživateli bych vypsal po odeslání příslušnou hlášku.

---
Jinak všem zúčastněným velmi děkuju za názory, které mě dovedly k následujícímu závěru:
Udělám kompromis, a sice ten, že pokud uživatel vyplní svojí e-mailovou adresu, bude moci svůj příspěvek ověřit sám. Pokud ne, bude muset být tento příspěvek ověřený adminem, tzn. že čas, kdy se příspěvek zobrazí v guestbooku, nebude závislet na samotném přispěvateli, ale na adminovi.

Vlastně tak zároveň poznám, jak to skutečně je - čemu vlastně lidi dají přednost. Osobně bych si tipnul, že to bude tak 1:1.
user243
Profil
nevím, jak by se někomu líbila časová prodleva; mohlo by to být tak, že když nevyplní mail, tak to přijde na Váš mail, ale celé mi to přijde lepší tak pro registraci;
Joker
Profil
user243:
nevím, jak by se někomu líbila časová prodleva
To už mi nepřijde tak otravné a nejeden web to má, že místo příspěvku se objeví něco jako [Příspěvek čeká na schválení] a teprve po nějaké době se objeví samotný text.
gully
Profil
user243:
nevím, jak by se někomu líbila časová prodleva; mohlo by to být tak, že když nevyplní mail, tak to přijde na Váš mail, ale celé mi to přijde lepší tak pro registraci;
Na můj admin mail to přijde každopádně a odtamtud i jako SMS, ale já bohužel nesedím celý den u PC, abych to mohl hned potvrdit, takže ta časová prodleva tam je. Zato se v guestbooku ale neobjeví (tedy doufám) žádný bot spam, protože Guestbook, ve kterém je bot spam, určitě nedělá dobrý dojem na návštěvníky příslušných stránek a bude tam minimum nevhodných příspěvků. Důležité je o obou možnostech vložení uživatele informovat ještě před vložením příspěvku, aby měl možnost (a právě o tom to je) se rozhodnout, zda-li chce čekat, nebo ne. Registrace není nutná, jedná se pouze o ten guestbook, stránky registraci nepotřebují.
panther
Profil
gully:
Na můj admin mail to přijde každopádně a odtamtud i jako SMS
to jestli si začne někdo spamovat, tak se z toho telefonu asi zblázníš :-)
gully
Profil
panther:
no to asi jo :D.
Sir Tom
Profil
gully:
Je vůbec nutné do guestbooku (návštěvní kniha) zadávat e-mail? Já bych se na kolonku e-mail úplně vykašlal, ale vytvořil masivní spamový filtr, který nepustí nic, kde bude závadný obsah. Podle závadnosti obsahu pak můžeš určit, které zprávy se zobrazí hned, které po schválení adminem, a které se neschválí vůbec. Můžeš také to udělat tak, že neschválené zprávy se závadností např. od 10 do 25 % se zobrazí automaticky do 6 hodin, pokud je admin do té doby nevyhodí. Také můžeš do celé "hry" zapojit ostatní uživatele, a pro každou zprávu dát odkaz "Nahlásit nevhodný obsah". Pokud bude mít zpráva např. 3 nahlášení, tak se stanou závadnou na 75 %, a teprve admin ji může znovu "odzávadnit".
gully
Profil
Sir Tom:
Je vůbec nutné do guestbooku (návštěvní kniha) zadávat e-mail?
Právě že není, to záleží na uživateli.

Já bych se na kolonku e-mail úplně vykašlal, ale vytvořil masivní spamový filtr, který nepustí nic, kde bude závadný obsah.
Ale tady může být dost obtížné takový zavadný obsah detekovat. Závadný obsah totiž nemusí vždy obsahovat závadná slova. Pokud bude "chytře" napsaný, tak není šance, aby ho takový filtr rozpoznal.

Můžeš také to udělat tak, že neschválené zprávy se závadností např. od 10 do 25 % se zobrazí automaticky do 6 hodin, pokud je admin do té doby nevyhodí.
A jak bych podle tebe měl určit procento závadnosti, podle čeho?

Také můžeš do celé "hry" zapojit ostatní uživatele, a pro každou zprávu dát odkaz "Nahlásit nevhodný obsah".
To právě není potřeba, pokud to udělám tak, jak jsem napsal. Možnost nahlášení závadného obsahu anonymními uživateli může nadělat zbytečné problémy - někomu se něco nebude líbit a nahlásí to. Navíc průměrně zkušený anonymní uživatel dokáže nahlásit takový obsah x-krát za sebou a tím, díky automatickému "75% systému", příspěvek skrýt.

Celkově bych řekl, že tato koncepce bude spíš fungovat pro registrované uživatele, takže zůstávám u původní, a řekl bych, že na implementaci jednodušší, koncepce. Ale každopádně díky za názor!
Sir Tom
Profil
gully:
Ale tady může být dost obtížné takový zavadný obsah detekovat. Závadný obsah totiž nemusí vždy obsahovat závadná slova.
Ale to nemusí být pravda. Nemusí se jednat o pouze o závadná slova, ale třeba o slovní výrazy a druhy. Můžeš třeba kontrolovat jestli se nějaké písmenkou neopakuje za sebou vícekrát jak dvakrát. Jestli text neobsahuje odkaz. Jestli text neobsahuje sprostá slova. Jestli text neobsahuje mnoho málopismenných slov. Atd. - existuje spousta věcí, které se dají kontrolovat.

A jak bych podle tebe měl určit procento závadnosti, podle čeho?
To záleží na tobě a na tvém algoritmu. Každou závadu (viz výše) můžeš nějak oprocentovat a pak udělat sumu.

Možnost nahlášení závadného obsahu anonymními uživateli může nadělat zbytečné problémy - někomu se něco nebude líbit a nahlásí to.
Což je právě výhoda. Jestli někdo někoho začne urážet, tak se dozvíš. Musíš ten celý systém udělat tak, aby zprávu mohl nahlásit jen jeden člověk v jeden den. (Stejně jako PPC reklamu). Mimochodem - všimni si, že spousta webů má u příspěvků tlačítka LIKE a NOT LIKE. Když nějaký příspěvek dostane moc NOT LIKEů, tak je něco s příspěvkem v nepořádku a měl by zasáhnout admin...
gully
Profil
Sir Tom:
Ale to nemusí být pravda. Nemusí se jednat o pouze o závadná slova, ale třeba o slovní výrazy a druhy. Můžeš třeba kontrolovat jestli se nějaké písmenkou neopakuje za sebou vícekrát jak dvakrát. Jestli text neobsahuje odkaz. Jestli text neobsahuje sprostá slova. Jestli text neobsahuje mnoho málopismenných slov. Atd.
No vzdyť to právě říkám a ani se nemusí jednat o žádné slovní druhy a věci, které tady uvádíš. Příklad závadného příspěvku: "Tento guestbook není k ničemu, protože je to všecko podfuk a ti kdo jej provozují nejsou těmi, za koho se vydávají!". Asi uznáš, že takový příspěvek do guestbooku nepatří, i když se v něm nevyskytuje nic z toho, co jsi uvedl.

existuje spousta věcí, které se dají kontrolovat.
Přesně tak, existuje toho skutečně spousta a to se bavíme pouze o jednom jazyce. A co když tam bude přispívat třeba Slovák, Angličan, Němec, Francouz ... ?

To záleží na tobě a na tvém algoritmu. Každou závadu (viz výše) můžeš nějak oprocentovat a pak udělat sumu.
Samozřejmě, že by to záleželo na tom algoritmu a s procenty, jak to popisuješ ty, to prostě tak jednoduše fungovat nemůže. Míříš v podstatě k nějakému samoučícímu se algoritmu.

Což je právě výhoda. Jestli někdo někoho začne urážet, tak se dozvíš. Musíš ten celý systém udělat tak, aby zprávu mohl nahlásit jen jeden člověk v jeden den. (Stejně jako PPC reklamu).
Možná jsem se špatně vyjádřil, a tak jsi nepochopil, co jsem chtěl říct. Takže uvedu konkrétní příklad:
Budou existovat dva přispěvovatelé, kteří se nemají rádi. Každý z nich bude psát do guestbooku normální příspěvek, ale každý z nich bude zároveň tomu druhému jeho příspěvek nahlašovat jako nevhodný, jen proto, že se nemají rádi. Už chápeš, co jsem tím chtěl naznačit?

Mimochodem - všimni si, že spousta webů má u příspěvků tlačítka LIKE a NOT LIKE. Když nějaký příspěvek dostane moc NOT LIKEů, tak je něco s příspěvkem v nepořádku a měl by zasáhnout admin...
LIKE a NOT LIKE není to samé, co závadný příspěvek. To, že se člověku něco nelíbí, neznamená, že to co se mu nelíbí je závadné a POZOR platí to dokonce i obráceně! Dokážu si živě představit to, že někdo pošle např. protistátně laděný příspěvek a spousta lidí ho olajkuje. LIKE/NOT LIKE pouze vyjadřuje názor. Když např. v guestbooku nějakého umělce bude příspěvek "Hrál/a jsi špatně", tak mu klidně můžu dát NOT LIKE, protože jsem na daném koncertu byl a mám na to opačný názor. A může se najít x lidí kteří k němu dají NOT LIKE. Přitom je ten příspěvek v naprostém pořádku a v knize by měl určitě zůstat.

Prostě to, co navrhuješ, je jednak velmi složité (a já nemám rád složité věci, protože skoro vždycky nejsou správné nebo jdou vyřešit jednodušeji) a podle toho jak to navrhuješ to nebude ani správně fungovat.
Sir Tom
Profil
gully:
Asi uznáš, že takový příspěvek do guestbooku nepatří
Já bych ho v GB nechal...

Každý z nich bude psát do guestbooku normální příspěvek, ale každý z nich bude zároveň tomu druhému jeho příspěvek nahlašovat jako nevhodný, jen proto, že se nemají rádi.
Když budou příspěvky anonymní, tak jak druhý přispěpovatel pozná, že se jedná o příspěvek 1. přispěvovatele?


LIKE a NOT LIKE není to samé, co závadný příspěvek.
Není, ale princip je stejný... podle plusek a mínusek u příspěvku poznáš jeho dojem na návštěvníka... To bys ale musel vyzkoušet v praxi a ne to teoreticky zavrhnout.

to, co navrhuješ, je jednak velmi složité (a já nemám rád složité věci, protože skoro vždycky nejsou správné nebo jdou vyřešit jednodušeji) a podle toho jak to navrhuješ to nebude ani správně fungovat
To je tvůj názor - když se s tím nechce programovat, tak klidně udělej lehčí řešení. :) Já ti ze svých zkušeností z praxe můžu říct, že pro guestbook stačí ten antispamový algoritmus.
jenikkozak
Profil
Sir Tom:
Já bych ho v GB nechal...
Ukážeš nám ten svůj GB, kde necháváš pomluvy na sebe? Pokud možno ještě takovou situaci, kdy budeš podobné tendence rozdmýchávat.

Když budou příspěvky anonymní, tak jak druhý přispěpovatel pozná, že se jedná o příspěvek 1. přispěvovatele?
Podle toho názoru. Nemusí se druhému přispěvovateli líbit, ale přesto se nemusí jednat o nepohodlný obsah. Když si třeba představíš diskusi k volbě prezidenta a objeví se tam člověk, který napíše, že by chtěl volit někoho konkrétního, a uvede vlastnosti, které se mu na kandidátovi líbí, schytá hromady „disliků“ od stoupenců ostatních kandidátů. Neznamená to však, že by jeho příspěvek byl lživý nebo nepohodlný.

To bys ale musel vyzkoušet v praxi a ne to teoreticky zavrhnout.
A tys to zkusil? Pak bys totiž věděl, že spoléhání na lajky a dislajky ti nepomůže.

Já ti ze svých zkušeností z praxe můžu říct, že pro guestbook stačí ten antispamový algoritmus.
Neostýchej se a klidně sem přidej ukázku té umělé inteligence.
gully
Profil
Sir Tom:
Když budou příspěvky anonymní, tak jak druhý přispěpovatel pozná, že se jedná o příspěvek 1. přispěvovatele?
Nemusí, ale mohou. Třeba jeden si bude říkat Sir Tom a druhý gully. Anonymními příspěvky jsem měl na mysli takové příspěvky, ke kterým není přiřazena ověřená e-mailová adresa, samozřejmě do guestbooku každý musí vložit své jméno nebo svoji přezdívku.

Jinak vše je již implementováno a jen čas ukáže, jak se to osvědčí.
Sir Tom
Profil
jenikkozak:

schytá hromady ‚disliků‘ od stoupenců ostatních kandidátů. Neznamená to však, že by jeho příspěvek byl lživý nebo nepohodlný
To ne, ale aspoň to na "něco" poukáže. Můžeš si třeba udělat statistiku všech lajků a dislajků. Počítat jejich poměry, počítat poměry mezi příspěvkem a všemi příspěvky. Zjišťovat, kdo dává dislajky. Zjišťovat, zda-li ten, co dává dislajky si sám sobě dává lajky. A spoustu dalších věcí...

A tys to zkusil? Pak bys totiž věděl, že spoléhání na lajky a dislajky ti nepomůže.
Jo, zkusil. Podle plusek a mínusek toho můžeš zjistit docela dost (viz výše), ale ne všechno. Nicméně já tento systém +/- nemám rád. Mnohem raději používám různé algoritmy a analýzy obsahu příspěvků.

Neostýchej se a klidně sem přidej ukázku té umělé inteligence.
Ty stránky, kde ten antispam je, mohou mít pro někoho pornografický obsah, čili odkaz sem dávat nebudu. Jestli máš zájem, napiš mi do e-mailu.
jenikkozak
Profil
Sir Tom:
Můžeš si třeba udělat statistiku všech lajků a dislajků. Počítat jejich poměry, počítat poměry mezi příspěvkem a všemi příspěvky. Zjišťovat, kdo dává dislajky. Zjišťovat, zda-li ten, co dává dislajky si sám sobě dává lajky. A spoustu dalších věcí...
Tady ale nejde o statistiky, ale rozlišení, jestli je nebo není příspěvek nežádoucí.

Ty stránky, kde ten antispam je, mohou mít pro někoho pornografický obsah.
Nechtěl jsem obrázky, videa ani zvuk. Bohatě mi stačí skript. :)
Sir Tom
Profil
jenikkozak:
Je to komerční web a nechci to takhle veřejně zde zobrazovat, takže ten e-mail leda, ale tak třeba kousek, který zabraňuje některým robotům přidávat odkazy a e-maily je udělán přes regulární výraz - neprojde nic co vyhovuje: /[<>]|@|http|www|\"|\'/i
jenikkozak
Profil
Sir Tom:
Zde byl text, který by Tomův regulární výraz nebyl schopen odfiltrovat.
Teď mi ukaž regulární výraz, který dokáže část mého příspěvku výše vyhodit. Je totiž jasné, že sem do konverzace určitě nepatří. Dá se také předpokládat, že kdyby tu byla možnost lajkování a toto téma bylo trochu více navštěvované, jistě by se tu našla hromada škodolibců, kteří by můj příspěvek lajkovali. Můžeš si to ověřit třeba na stránkách živě. Mají tam nejvíc záporných hlasů příspěvky, které jsou nemístné, nebo ty, které jsou proti srsti většiny přítomných diskutérů?
user243
Profil
ta tvá věta je prosti srsti mně;
Sir Tom
Profil
jenikkozak:
Drahý Jeníku, samozřejmě, že máš pravdu. Již tradičně volíš extremní příklad, který patrně žádný algoritmus neoznačí jako závadný. Bohužel tento příklad je trochu nemístný, protože by prošel i přes verifikaci, i přes ověřování e-mailů, apod. Z toho tedy také plyne, že tento příspěvek by měl zablokovat už sám nějaký člověk z masa a kostí. Jak toho ale člověka přivolat? (3 stejná písmenka za sebou? Poměr mezi LIKE a DISLIKE? Určitý počet kliků na "Nahlásit příspěvek jako nevhodný"?)

Narozdíl od tebe se ale snažím gullymu odpovědět a poradit s jeho problémem. Nabídl jsem mu několik myšlenek, jak by GB mohl ochránit proti nežádaným příspěvkům (jak proti příspěvkům od robotů, tak i proti příspěvkům s nežádoucím, či urážlivým obsahem). Jaké myšlenky jsi nabídl ty? Stavíš svoji kariéru na kritice mě, stejně jako Aristoteles se proslavil na kritice Platóna? Tak prosímtě nekecej a nabídni pořádné řešení podle svého!

jistě by se tu našla hromada škodolibců, kteří by můj příspěvek lajkovali
Nemůžeš srovnávat DJPW a Živě.cz. Každá z těchto stránek je navštěvovaná jiným typem lidí. Zde se řeší problémy a tam se komentují články. Tady jsou diskutéři a tam jsou přispěvovatelé. Mezi diskuzí a příspěvky je dost zásadní rozdíl.

A teďka obraťme roli a ukaž nám teda způsob podle sebe, který by vyhodil z diskuze onu tvoji nemístnou větu vůči mně.
jenikkozak
Profil
Sir Tom:
Jaké myšlenky jsi nabídl ty? Stavíš svoji kariéru na kritice mě, stejně jako Aristoteles se proslavil na kritice Platóna? Tak prosímtě nekecej a nabídni pořádné řešení podle svého!
Považuji za přínosné nejen poskytnutí 100% funkčního řešení, ale také odhalení nedostatků chybného přístupu. Chybné řešení není o nic lepší než žádné. Popsání chyb špatného řešení může vést k dosažení výsledku alespoň uspokojivému. Kritizování žádného řešení nevede nikam. Neznamená to však, že tvé příspěvky (spolu s jejich vyvrácením) vnímám jako nepřínosné.

Nemůžeš srovnávat DJPW a Živě.cz. Každá z těchto stránek je navštěvovaná jiným typem lidí. Zde se řeší problémy a tam se komentují články. Tady jsou diskutéři a tam jsou přispěvovatelé. Mezi diskuzí a příspěvky je dost zásadní rozdíl.
Jde o tvé osobní názvosloví. Mezi diskusí a příspěvkem je rozdíl jako mezi každým celkem a jeho částí.

A teďka obraťme roli a ukaž nám teda způsob podle sebe, který by vyhodil z diskuze onu tvoji nemístnou větu vůči mně.
Jasně. Byla to ukázka komentáře, který by se přímo tobě nelíbil, když jsme viděli, že [#15] gullův příklad bys v jeho knize návštěv nechal. Promiň, jestli tě můj komentář naštval.
Sir Tom
Profil
jenikkozak:
Kritizování žádného řešení nevede nikam.
Souhlasím, ale je možno nabídnout opravu, či alternativní řešení ke kritizovanému.

Mezi diskusí a příspěvkem je rozdíl jako mezi každým celkem a jeho částí.
Nevím, zda-li jsme se pochopili. Na živě.cz přispívají uživatelé typu: "Neeee! Windows 8 už nikdy!!!!", "Hmmm - zajimave", "spravte si ty spravy už..." a zde na DJPW jsou příspěvky, které mají hlavu a patu (dodržují nějaké normy a pravidla, jsou obsahově věcné, apod.). Já v příspěvcích na živě.cz a djpw cítím rozdíl, a tak by i ke každému z obou typů příspěvků mělo být jinak přistupováno.

Promiň, jestli tě můj komentář naštval.
Beru.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: