Autor Zpráva
koudelacek
Profil *
Zdravím,
mám jeden takový složitější problém.
Jde o načítání RSS novinek z různých serverů - problém je ten, že pokud se duplikuje článek, tak jej smažu - jenže - páni redaktoři jsou tak inteligentní, že zveřejní článek, kde za 5 minut změní titulek, takže já pak mám na stránkách dva články se stejným titulek, ale vždy je tam rozdíl např. v jednom slovu..
Nemá někdo náhodou nápad, jak by se dal sestrojit skript, který by porovnal titulky a pokud by se třeba alespoň z 80% zhodovaly, tak by je vyhodnotil jako stejné ?

Děkuji za nápady..
Majkl578
Profil
Podívej se na funkce similar_text, levenshtein a soundex.
koudelacek
Profil *
Děkuju moc :)

Vaše odpověď

Mohlo by se hodit

Odkud se sem odkazuje


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: