Autor Zpráva
gekon
Profil *
Ahoj, tohle je otázka pro někoho, kdo má trochu zkušenosti se statistikou.

Zavádím hodnocení položek dle věku, mám 8 skupin: 0–10, 10–15, 15–25, 25–35, 35–45, 45–55, 55+, nezadán věk. klasicky zaznamenávám počet hlasů a jejich hodnotu. Jde mi o nějaký inteligentní vzorec pro výpočet „průměrného“ hodnocení – medián ani průměr mi zde nepřipadají moc vhodné.

Statisticky by se měla imho dávat priorita na nejvyšší hodnocení – protože každá věc má cílovou skupinu a podle ní by měla mít hodnocení. (ehm, pokud melu nesmysly, tak mě vyveďte z omylu).

Má s tímto někdo zkušenosti ?
Taps
Profil
gekon:
A když budu mít 25, tak do jaké skupiny patřím (15–25, 25–35) ??
gekon
Profil *
hm naspal jsem je špatně, ty skupiny jsou 0-9,10-14,15-25 ...
Stano
Profil
môžeš tam popridávať koeficienty. ak je cielova skupina 15-25 tak ju prenásob dvoma 10-14 prenásob 1,5 atd. ak predpokladaš že cielova skupina bude posielať aj najviac odpovedi tak to zasa možeš dať na druhú všetko a nakoniec to odmocnit dvoma. tam sa dá vymysliet stovky možností. záleží na tom čo presne potrebuješ
Joker
Profil
gekon:
Z toho popisu mi není úplně zřejmé jak to má fungovat, ale asi by šlo použít tzv. vážený průměr.
Jde vlastně o první část Stanova příspěvku: Pro každou kategorii se stanoví koeficient (váha), kterým se vynásobí hodnoty v té kategorii. Pak se spočítá normální průměr.

Jestli to dobře chápu, v tomhle případě má váha záviset na celkovém počtu hlasujících v dané skupině.
V tom případě by ale myslím fungoval dobře i jednoduchý průměr.
Dá se předpokládat, že lidi z těch „necílových skupin“ vesměs nebudou vůbec hlasovat. Čímž i u jednoduchého průměru bude hodnocení záviset hlavně na té největší skupině, jednoduše protože je největší.

A ještě jedna poznámka, počet hlasujících nemusí vypovídat o cílové skupině položky, ale o struktuře návštěvníků webu. Řekněme například, že bude položka zajímavá pro skupinu 45-55, ale převážná většina návštěvníků bude z kategorie 15-25. Taková položka pak nejspíš bude mít nejvíc hlasů z kategorie 15-25 a pravděpodobně budou spíš negativní. Ale nevyplývá z toho, že cílová skupina položky ji hodnotí negativně, ale že cílová skupina položky nechodí na ten hodnotící web.

Dám příklad, jak by pak ten výpočet fungoval, zkrátím to na skupiny A, B, C, hodnocení 1, 2, 3 a hlasování bude:
\   1   2   3
A  60  50  20
B  20  30  30
C  10  15   5  
První krok je zjistit si počet hlasujících za skupiny: nejvíc má A (130), pak B (80) a C (30)
Teď se nabízí spousta možností, jak nastavit ty váhy. Můžu je dát napevno (např. ta co má nejvíc 2, druhá nejvyšší 1,5 a třetí 1), můžu dát pevný koeficient té největší nebo nejmenší a ostatní počítat podle relativního podílu hlasů (např.: největší je A, ta dostane 2, B dostane 2*(80/130) = 1,23 a C 2*(30/130) = 0,46). Případně úplně nejjednodušší způsob je, že samotný počet hlasů bude ten koeficient (tj. A bude mít 130, B 80 a C 30)
Prostě možností je spousta.
A teď jak se počítá ten vážený průměr. Řekněme, že největší skupina (tj. A) dostane 2 a ostatní podle poměru hlasů (tj. 1,23 a 0,46). Tím přenásobím počty hlasů, takže vážené počty hlasů podle skupin budou:
\   1   2   3
A  120 100  40
B   25  37  37
C   5   7   2  
Celkové vážené počty hlasů: 150, 144 a 79 a průměrné hodnocení 1,8.
(Pro zajímavost, hodnocení podle jednoduchého průměru by bylo 1,9)
gekon
Profil *
Joker:
Ten vážený průměr je zajímavá myšlenka. Díky tomu, jak píšeš, že budou hlasovat o položce lidé, pro které není určené (hlavně problém puberťáků) vzniká celkově problém s objektivitou. Hold budu muset u každé položky nastavit cílovou skupinu a u ní pak počítat s nejvyšším koeficientem.

Ono pořád lepší menší neobjektivita, než klasický příklad za všechny .. čsfd. Jé ono to má 87 procent, ale je to úplná blbost, protože je to určeno a hlasováno od lidí v jiné věkové skupině...
Joker
Profil
gekon:
ono to má 87 procent, ale je to úplná blbost
Proti tomuhle ale ten algoritmus nepomůže, protože tam záleží v jaké skupině jsem já a ne jaká hlasuje nejvíc.
Když například položka bude zaměřená na 20-leté, takže největší váhu bude mít skupina 15-25, a mně bude 60, naopak to tenhle efekt ještě zesílí.

V tomhle případě by dávalo smysl přidávat váhu hlasům skupiny ve které je návštěvník.

Poznámka trochu mimo: Systém asi nejbližší dokonalosti by byl zvyšovat váhu hlasů lidí s podobným vkusem, neboli lidí, kteří společně se mnou už hodnotili jiné položky a dali jsme jim podobná hodnocení. Ale bylo by to pěkně složité.
O něco jednodušší je to co dělají sociální sítě: Prioritu má hodnocení od lidí, kteří se sami zařadili do podobných skupin jako já.
gekon
Profil *
Joker:
"Poznámka trochu mimo: Systém asi n ..."
No nad tím sem přemýšlel, ale rovnou jsem to zavrhl ... moc dat ke zpracování a nelze to použitelně testovat na malém vzorku.

Ale jinak díky ..

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0