Autor Zpráva
pavelkos
Profil *
Zdravim,

potreboval bych na svem webu nejak zajistit navrhovani vyrazu po zadani preklepu
neco jako ma google Did you mean / Meli jste na mysli

Snazil jsem se zjistit, jestli k tomu nemaji nejake volne dostupne API, ale nejak nemuzu nic najit.
Nevite nahdou zda existuje?

Napadlo me jeste pouzit primo hledani google a skriptem si stahnout vysledne html a z toho si vyraz vyparsovat,
ale nevim, zda nedostanu treba ban na IP, pokud bude hledat treba 300x za den :(
Nebo jeste hur me za to vyradi z vysledku vyhledavani...

Nemate nejak napad?

Diky
Jonas Serych
Profil
http://interval.cz/clanky/google-suggest-aneb-naseptavac-s-xmlhttprequest/
nebo proste hledej google suggest
pavelkos
Profil *
Diky za odpoved, ale ja nemam na mysli google suggest,

ale opravu hledaneho vyrazu pri preklepu, ktera se zobrazuje nad vysledky vyhledavani.

Napr. pri zadani vyrazu gogle se vypise nad vysledky vyhledavani: Did you mean: google
ninja
Profil
pavelkos: myslim ze pouze na "preklepy" Google API nema. Bud pouzit komplet jeho hledani, nebo nasadit vlastni reseni. Vse ostatni bude poruseni licencnich podminek, pripadne nelegalni vytezovani cizi databaze.
pavelkos
Profil *
sakra, presne toho jsem se bal :(
ninja
Profil
pavelkos: preci ale neni problem stahnout si nejaky slovnik a pak je porovnavat s hledanym vyrazem pres nejaky foneticky algoritmus typu soundex nebo Levenshteina.
pavelkos
Profil *
Problem je, ze nejde o klasicka slovnikova slova, ale o vlastni jmena,
jako napr. nazev filmu, knihy, jmeno a prijmeni apod.
Joker
Profil
ninja
neni problem stahnout si nejaky slovnik a pak je porovnavat s hledanym vyrazem pres nejaky foneticky algoritmus typu soundex nebo Levenshteina.
Google na to ale myslím jde jinak- "statisticky": Pokud má hledaný výraz relativně málo výsledků, zatímco podobný výraz daleko víc, nabídne ten podobný.
pavelkos
Profil *
co vim ja, tak pokud uzivatel zada nejaky vyraz a neni nic nalezeno,
a pote ten vyraz opravi a neco se najde a je vyraz podobny, tak si tyto informace ulozi

Pokud se dana situace nekolikrat opakuje, tak si tento prekled "sparuje" s danym vyrazem.

K tomuhle je vsak potreba spousta dat... :(
Vytvorit podobnou featuru je na malem webu prakticky nemozne.
ninja
Profil
pavelkos: kvalite Googlu se asi tezko priblizite, nicmene i na anglictinu postaveny soundex dokaze pomoci i u male databaze vstupnich slov. Ze nepouzivate obecna slova nevadi, ty nazvy filmu a knih snad nekde ulozene mate, ne?
imploder
Profil
ninja
preci ale neni problem stahnout si nejaky slovnik a pak je porovnavat s hledanym vyrazem pres nejaky foneticky algoritmus typu soundex nebo Levenshteina.
Tipuju, že napsat fonetický algoritmus pro češtinu bude o dost jednodušší než pro angličtinu (resp. není to problém pro většinu slov i bez slovníku). Podobnost fonetických reprezentací by se asi měla řešit nějak líp, než jenom jako podobnost řetězců - tj. brát v úvahu které zvuky jsou si podobné a které ne.

U překlepů ale (pokud člověk ví správně, jak se to slovo píše) asi nebude fonetika hrát roli a bude to spíš o náhodě a rozmístění kláves na klávesnici (jejich blízkost rozhodně neodpovídá blízkosti zvuků, které ty písmena představují).

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: