Autor | Zpráva | ||
---|---|---|---|
nethor Profil |
#1 · Zasláno: 9. 8. 2012, 23:31:40
Zdravím, řeším celkem zajímavý problém;
Vyhledávání duplicitních inzártů v DB (pro setřídění, ev. smazání - provádí Admin, manuálně). Vyhledávání podle přesné shody není vhodné, protože při změně byť i jediného znaku se žádná duplicita nenajde. (Nezbední uživatelé by to mohli snadno obejít.) Řeším to tak, že si z textu inzerátu vytáhnu řekněme 5 nejdelších slov a pak hledám jejich výskyt v ostatních inzerátech. Uložím do pole id nalezených duplicitních inzerátů a pak je pomocí where id in (...) vypíšu. Nevím ale, jak seřadit inzeráty tak, aby byly duplicity zjevně za sebou. Dále by mě zajímalo, jestli tento problém nejde řešit nějak elegantněji např. přes fulltxt v mySQL. |
||
Časová prodleva: 3 dny
|
|||
Joker Profil |
#2 · Zasláno: 12. 8. 2012, 21:28:33
nethor:
Možná by šlo použít fulltextové vyhledávání a pak se rozhodovat podle výsledného skóre. |
||
Časová prodleva: 12 let
|
0