Autor Zpráva
Yuhů
Profil
Jak tak řeším fulltextové vyhledávání, potřebuju vyřešit pár zapeklitých hádanek. První z nich je tato:

Představte si, že máte k dispozici nekonečné množství lidí, kteří by sestavovali odpovědi na jednoduché komerční dotazy. Požadovaným výstupem je, aby co nejlépe určili pořadí stránek, které mají vyjíždět v SERPu. Příkladem dotazu budiž třeba slovo hadice. Otázka zní, jak jim vysvětlíte, co po nich chcete. Jak mají ty stránky seřadit, aby ty nejlepší byly nahoře a ty špatné dole? Vůbec mi nyní nejde o nalezení algoritmů, jak stránky řadit. Jde mi o to, jak lidem popsat, které stránky jsou na ten dotaz dobré (a mají být nahoře) a které jsou špatné. Jak to ti lidé poznají, podle čeho?

Aneb jaké vlastnosti mají mít stránky, které mají být vepředu na slovo hadice, nebo hosting, nebo dovolená, nebo povinné ručení nebo podobné
dotazy?

Když se nyní zkouším lidí ptát, aby mi stanovili pořadí stránek na podobné dotazy (v podstatě transakční dotazy), tak to každý udělá diametrálně jinak. Vysvětlení je takové, že kvalita většiny shopů a stránek o hadicích je přibližně stejná (všechny prodávají hadice a píšou o nich nějaké plky), takže je i stejně dobré každé jejich seřazení. Jenomže pokud je ta jejich kvalita stejná a správné pořadí nedokáže určit člověk, jak to mám chtít po stroji?

Pomozte mi ta kritéria najít. A přestaňte přitom prosím myslet jako programátoři. Vůbec mi teď nejde o algoritmus pro počítač a vůbec neřeším, jestli se ta kritéria, která navrhnete, dají spočítat. Ptám se, podle čeho by výsledky seřadili inteligentí lidé. Dík za nápady.
Adrifinel
Profil
Když to vezmu co by jako uživatel, tak bych asi dotazy viděla na spojení levně - hadice. V dnešní době hodně lidí hledá levné věci, takže bych na vrch dávala ty stránky, které nabízejí levně hadice a zároveň nevypadají jako ostatní stránky, příjmnější grafika, lepší podmínky apod.
Cody
Profil
Myslím, že co nejvýše by měli být weby které jsou přehledné, mají dostatek zajímavého a unikátního obsahu a dokážou nejlépe pomoct na daný dotaz. Což je ale, jak sám říkáš, těžké určit obecně. Sakra, hodně těžká otázka.
Lokutus
Profil *
Nejlepší web o hadicích je ten, kde jednak najdu použitelné informace, druhak tam ty hadice rychle a pohodlně nakoupím. Nahoře by tedy měly být ty přehledné a informativní weby a e-shopy s dobrým UX, nejširší nabídkou a nejlepším poměrem cena/výkon.
Joker
Profil
Yuhů:
Tak v první řadě by nahoře měly být weby obsahující to co hledám. Ovšem když hledám „hadice“, pořád je víc možností, co vlastně chci. Můžu shánět informace, nebo chtít nějaké koupit. Když chci nějaké koupit, můžu chtít e-shop, nebo chci najít kamenný obchod.

Kdybych konkrétně hledal e-shop s hadicemi, měly by nahoře být ty „nejlepší“; Asi bych preferoval ty kde už jsem nakoupil a byl jsem spokojený, „renomované“ obchody, taky cenovou úroveň, přičemž ale obchody s příliš nízkými cenami mi zase přijdou podezřelé.
jenikkozak
Profil
Cody:
Myslím, že co nejvýše by měli být weby které jsou přehledné, mají dostatek zajímavého a unikátního obsahu
Ale pozor na tu unikátnost. U e-shopu mi je úplně jedno, jestli používá vlastní texty, nebo kopie charakteristik od výrobce. E-shop volím podle úplně jiných kritérií. A sice takových, které vyhledavač nemá možnost zohlednit.
Když někdo na stránku nafláká ty rádoby seooptimalizované články, které mají až úžasnou koncentraci klíčových slov, bude mít také skvěle unikátní obsah.

Yuhů:
U hostingů by vepředu mohl být nějaký dobrý srovnávací web. Jenomže to by asi nejprve musel nějaký takový dobrý vzniknout.
Google na rozdíl od Seznamu mi nabízí stránku www.jakpsatweb.cz/hosting.html. Budu-li opravdu hledat „hosting“, nějaké takové obecné informace se mi budou hodit. Když budu hledat poskytovatele prostoru pro svůj další web, pravděpodobně tento dotaz nepoložím.
Rozhodně mě ale nezajímá Wikipedie. Jistou dobu jsem sledoval, že mi ji Google nabízí až příliš často. Obecná slova ale nepotřebuji vysvětlovat, u odbornějších věcí budu hledat na specializovaném webu.
„Hadice“ jsou příliš obecné, pořádné rozdíly mezi nimi nejsou, dají se koupit v krámku na rohu. Ty bych moc neřešil. Když nebudu hledat klasickou hadici, tak to k dotazu přidám.
„Dovolená“ - nedovedu si představit, co bych hledal, kdybych pokládal tento dotaz. Chci jet do Afriky, na místní hory, nebo mě zajímá, jestli mám na dovolenou vůbec nárok?

Pokud by někdo dělal vyhledavač jen pro mne, chtěl bych, aby mi na obecné dotazy dával obecné odpovědi. Např. „svatba“ napíšu, když vůbec nebudu vědět, co mě čeká. Teprve pak budu hledat „svatební oznámení“, „svatební šaty“, „jak sehnat nevěstu“ nebo tak něco. Při zadání konkrétnějšího dotazu mě zas už vůbec nezajímá obecné povídání o tom, že svatba může být velká nebo malá.
Cody
Profil
jenikkozak:
Proto tam píšu zajímavé. Prostě dobrý obsah, který přesvědčí a který není 1000x opisovaný.
jenikkozak
Profil
Cody:
Já vím. Ale i kdyby byly dotazy řazeny ručně, jak udělají, aby vybraly stránky s informacemi, které budou zajímavé pro mne, pro holku z páté třídy i pro nějakého doktora? Odborné věci bude děcko pokládat za bláboly. Věci, které by se jemu líbily, budou naprosto nevhodné pro jiného. A robot v tomhle nemá šanci už vůbec. To by musel chápat význam sdělovaných věcí a mít v dané oblasti nějaké znalosti, pro jejichž získání je často nutná praxe.

Vezměme konkrétní případ. V Česku existuje jen pár lidí, kteří mají oprávnění prodávat sadbu českého česneku. Přesto existují tisíce inzerátů prodejců, kteří levně koupí španělský nebo polský česnek a prodávají ho pod názvem „český“. Na prstech jedné ruky spočítate v Česku odborníky, kteří dokážou původ česneku poznat. Robot ani drtivá většina lidí nemá šanci poznat, že všechno ostatní je podvod.
A téměř všichni z těch, co jej prodávat skutečně mohou, používají shodné (řekněme neunikátní, nezajímavé) popisy.
Řazení podle ceny, které tu bylo také navrhováno, bych považoval za zlo. Není problém koupit za 130 Kč španělský česnek a prodat ho za 150 Kč jako český. Zatímco skutečně český se za tuhle cenu prodat nedá. (Je moc nízká) Znamenalo by to, že vyhledavač by uživatelům nabídnul pouze podvodné nabídky a ty legální by šoupnul kamsi dozadu.
Cody
Profil
jenikkozak:
Je třeba si uvědomit, že to není možné řadit dle každého uživatele ale najít nějakou střední hodnotu.
mart1cek
Profil
Pokud zadám dotaz typu "hadice", "dovolená", "povinné ručení", tak to většinou znamená, že o daném tématu netuším vůbec nic a dalším krokem je prohlídka výsledků a upřesňování dotazu.

Takže nahoře bych čekal nejspíš definici těch slov, třeba ve Wikipedii. Vyhledávač by mohl předvídat potřebu zpřesnění dotazu a rovnou se mě zeptat, třeba: "chcete: koupit hadici, zjistit jak se hadice vyrábí, najít druhy hadic, ..."

Představuju si to jako kdybych se bavil s kamarádem a najednou on vybafl "Hadice?!". Jak bych reagoval?
Marek Prokop
Profil
Dušane, tvůj problém hezky ukazuje, že chtít po lidech, aby seřadili výsledky na takto obecné dotazy, není dobrý nápad :-) Ještě vadnější je argument, jak něco chtít po stroji, když to nedokážou lidé. Od toho přeci stroje jsou, aby dělaly věci, které lidé nedokážou.

Jdeš na to špatně.

(Víc případně soukromě, asi se sem nebudu pro odpověď vracet.)
duben
Profil
Pokud zadám hadice, což je opravdu hodně obecný dotaz, můžu chtít hadice na zahradu, do auta, samičku od hada (protože jsem třeba dítě tak hledám hada a hadici :) ....

Ideálně bych jako výsledek viděl mix wikipedie, eshopů, webů s texty ve stylu "zkusím štěstí", náhodně namixované. Časem bych čekal že když se někoho zeptám (jedno jestli člověka nebo robota) co podobné dotazy dostává často, tak podle toho s čím se lidi nejčastěji na podobný dotaz spokojili (tedy odkud je malý bounce rate), nebo kteří hned nehledali to samé, tak to jim budu dávat mezi prvními .... a podle historie to postupně upravovat, nebál bych se to řešit i podle lokality ... třeba lidi na venkově můžou častěji hledat kde koupí hadici, lidi z města se chtějí neco dozvědět o hadech ...

Zároveň stejně jako v diskuzi s člověkem na podobný dotaz, bych se nebál nějakého pruhu pod vyhledávacím oknem ve stylu ... "ty brďo na tohle jde odpovědět od zrnka písku po celé vesmírné všehomíro, pomož mi trošku s tím co hledáš" a nabídnul nejčastější možnosti co při tomhle hledání jsou ... tedy "hledáš informace o hadicích?", "chceš koupit nějakou hadici?", "máš hada a nevíš jestli je to kluk nebo holka", "ptám se hloupě? napověz mi víc jak ti můžu pomoct" ... a podle toho co by člověk zvolil bych mu pomáhal přizpůsobit hledání a výsledek. Spousta lidí se neumí ptát a spousta programátorů neumí vnímat co lidi chtějí. Takže prostě bych lidi postupně vedl k tomu co hledám. ... Hledám eshop? Tzn. chci něco koupit, budu chtít srovnávač ceny více eshopů, kde uvidím i kvalitu eshopu (kde jsou lidi spokojení) a sem tam vložím i nové (ať mají šanci se prosadit). Druhá možnost, vyhledávání prodejců hadic v kamených obchodech v mém okolí ....
Ab
Profil *
KOLIK lidi (skupin lidí), tolik bude různých pořadí! Jak už tady někteří připomínali, každý má jiný pohled, co si představuje za nejlepší výsledek, takže kolika lidí se zeptáš, tolik dostaneš různých výsledků. Záleží přece na tom, co je dotyčný zač, kolik má let, z jaké skupiny pochází, zda je to odborník na daný obor, ze které dotaz pochází, nebo zda je to laik, který hledá zase něco úplně jiného.

Ideální by tedy bylo rozdělit dotazy dle skupin a pro každou skupinu vybrat odborníka, který nabídne dle jeho pohledu odpovídající seznam. To konfrontovat s pohledem laika, optimalizovat ještě dle různých věkových skupin, vybrat třeba i regionálně specifické dotazy.

Když budu mít takový úkol a nechci vytvořit jen obecný pelmel, který neposlouží ani odborníkovi ani laikovi, a budou se tam míchat výsledky pro děti s výsledky pro důchodce, tak nebude spokojený nikdo. Musím tedy pro každou takovou skupinu udělat jiný seznam, pro ni nejvhodnější.
koss556
Profil
Takhle, jak jsi správně podotknul, je kvalita všech stránek víceméně stejná, ale já bych se na to podíval ekonomicky. Když budu vědět, že moje stránka se může na první místo dostat kvalitou, tak jí například udělám tak, aby toto řešila, například udělám seznam hostingů a seřadím je nejlevnější, s přidanými službami, recenze atd... Problém je jiný, přeci nebudu takový web dělat, když je mi jasné, že ho vyhledávač bez různých SEO triků na první místo nedá, naopak pro vyhledávač udělám web, který je víceméně zpravodajský a vím, že z něho půjdou dobré výsledky na long tail.

Je to vlastně začarovaný kruh, ale podle mého názoru budoucnost je ta, že vyhledávače alespoň u těch opravdu hledaných fází budou spolupracovat s autory webů. Proč prostě nespolupracovat s někým, kdo hadicím rozumí na zobrazování výsledků o hadicích?
mirecekp
Profil
Já bych nejprve omezil skupinu lidí na nějakou konečnou množinu dotázaných. Zde by se pak jistě našla řada stejných odpovědí, tedy webů, které budou doporučeny nejčastěji (ne ve stylu počtu zpětnách odkazů, ale ve stylu facebook like) a nejlépe se při předložení výsledků zeptat na cílovou skupinu tazatele a předložit mu adekvátní výsledek ze skupiny původně dotazovaných...

Trochu zdlouhavé ale myslím, že je větší pravděpodobnost že ona první stránka bude ta kterou hledá tazatel.
Ab
Profil *
mirecekp:
Však to už tady bylo několikrát zmíněné. Výsledek seznamu musí být dle toho, co je daný uživatel zač. Když se mne někdo zeptá na obecný dotaz např. "kniha", míněno ve smyslu, jaké knihy doporučuji k přečtení, tak každému člověku dám jiný seznam.

Dítěti, profesionálovi v nějakém oboru, důchodci, člověku z vesnice nebo z Londýna. každý má jiné potřeby a platí to pro všechny dotazy.
avaranger
Profil
Na obecné dotazy obecné odpovědi. A rádoby funnel - nabízet zpřesňování výsledků.

Není možné vyřešit lidem jejich problém s tím, že neumí popsat co chtějí :) Velkej průšvih současných vyhledávačů je IMO v tom, že neumožňují filtrování výsledků. Typický use case je hledám "Lenovo R400 recenze" a chci vidět recenzi. Jenže prvních 5 stran je vytapetovaných eshopy. Co bych ocenil je možnost vyfiltrovat případně zobrazit pouze eshopy/recenze/blogposty/...

Celý ten "katalogy jsou fuj" hype přesunul situaci do druhého extrému. Teď si nemůžou lidí nic upřesňovat a jednotlivé výsledky jsou atomické. Co třeba funkce "podobné stránky jako tato" které vyhodí stránky, které jsou relevantní na toto téma a přitom podobné vybrané. Pokud člověk hledá něco velmi konkrétního, tak má často stejný problém jako s něčím velmi obecným.
Yuhů
Profil
Tak zatím jsme se víceméně shodli na následujících kritériích:

nízká cena
příjemná grafika
přehlednost
informace a zároveň nákup
spokojení nakupující
dobrá UX
renomé
srovnávací weby (pokud existují)

Další postřehy, se kterými souhlasím:

nízké ceny jsou podezřelé
u shopů není důležitá unikátnost textu
na obecné dotazy obecné odpovědi
hodnotící lidé by museli být trochu experti (česnek)

A pár mých poznámek k tomu zadání:

Neřeším víceznačnost dotazů (zahradní hadice x samice od hada), to je téma samo o sobě. Souhlasím, že to je problém, ale ne v této souvislosti.

Jasně, že by se to prohnalo nějakým průměrováním nebo zpracovalo statisticky. Není problém, že by se názory lidí lišily, pokud bude rozložení názorů statisticky šikmé ve prospěch nějakých webů.

Mít na různé obory experty je asi dobrý nápad.
Různý typ uživatelů (věk atd.) může být problém.

Marek Prokop standardně tvrdí, že kladu špatný dotaz, což mě spíše utvrzuje ve správnosti mého tázání. Nějaké další nápady?
Petr ZZZ
Profil
1.
Možná by bylo lepší neptat se, podle čeho by lidé měli řadit, ale podle čeho by řadili, kdyby mohli (a kdyby si dali práci s porovnáváním). Přemýšlel jsem nad tím a jediné, co mě napadá a dosud zde nebylo zmíněno, je otázka, zda by nebylo vhodné nějak zohlednit rozdíl mezi lidmi, kteří se chtějí informovat, a těmi, kteří chtějí nakupovat. Myslím si, že mezi nimi rozdíl je – například v tom, jakou mají či nemají rutinu v zacházení s internetem.

Řekl bych, že spektrum lidí, kteří se chtějí v internetu především informovat, začíná u těch, kteří jsou rádi, že ví jak počítač zapnout, zatímco spektrum těch, kteří chtějí v internetu nakupovat, začíná až na úrovni víceméně bravurního zacházení s počítačem a rutinního pobytu v internetu. Z tohoto pohledu by možná stálo za úvahu vyjít vstříc spíš těm, kteří hledají informace, a nabídnout na prvních pozicích weby, které vysvětlují, co to ta hadice je, a až potom ty, které nabízí hadici na prodej – protože ti, kteří chtějí hadici koupit, mají patřičnou rutinu a rychle si místo hadice zvyknou hledat hadice koupit, zatímco ti, kteří tu rutinu nemají, budou otrávení, protože neumí hledat hadice -eshop.

Dalším argumentem pro potlačení eshopů ve výsledcích by mohlo být to, že eshopů bývá u komerčních pojmů mnohonásobně víc než čistě informačních stránek. Snadno se potom stane, že eshopy je vytapetováno hned několik prvních stran výsledků a informační stránku aby jeden pohledal.

2.
Jednoduchým kritériem kvality stránky by mohl být výskyt překlepů a hrubek, podle následující úvahy: "Kdo nedá do kupy kloudný text, ten nemá čas anebo schopnosti anebo prostředky postarat se o kvalitu jakéhokoliv jiného aspektu své internetové prezence."
Toto téma je uzamčeno. Odpověď nelze zaslat.

0