Autor Zpráva
General
Profil *
Čus, potřeboval bych napsat regulár který bude vyhledávat na webovce absolutní URL adresy - klikací. Mám tu regulární výraz @<a.*href=["\'](http://.*)["\'].*>@i ale ten mi hází jen některé url a ječtě k tomu nejsou to čisté URL. Poradímě mi?

//dík
mckay
Profil
General:
preg_match_all('#<a[^>]+href="(http:\/\/([^"]+))"[^>]*>#is',$source,$array);


V $source bude obsah webové stránky získaný přes file_get_contents(); a v $array se budou vracet odkazy.

Použil jsem to na svého crawlera, takže to možná budeš moc použít.
General
Profil *
oki, moc dík, du zkusit..

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0