Autor Zpráva
Senky
Profil
Zdravím,
už dlhú dobu hľadám na internete akýkoľvek regulárny výraz, ktorý by dokázalo veriť, či je text URL, no nemá na začiatku protokol. Príklady správnych adries:

www.nieco.sk
nieco.sk
www.nieco.sk/adresar/subadresar/skuska.html
nieco.sk/adresar/subadresar/skuska.html

no všetko bezvýsledne. Asi najnádejnejšie vyzerajúci bol tento (cez preg_match):
/([a-z0-9\+\$_\-]+\.)*[a-z0-9\+\$_\-]{2,3}(\/([a-z0-9\+\$_\-]\.\?)+)*\/?$/i

no tak či tak dokáže prepustiť (a tam som sa sekol vždy) niečo takéto:

slovo druhé - domena.sk

a práve to je to, čo nechcem.
Vedel by mi niekto poradiť, alebo upraviť tento regulárny výraz tak, aby to fungovalo?
Ďakujem...
AM_
Profil
Těžko. Text, který nezačíná protokolem, není URL :) spolehlivý výsledek nebudeš mít nikdy, obzvlášť proto, že spousta lidí nedodržuje pravidla české typografie a neodděluje novou větu mezeou, třeba:
"chci si udelat web.co myslite zvladnu to?"
Algoritmicky nerozhodneš, zda web.co je webová adresa.
Ale můžeš se tomu přiblížit (a tyhle extrémní případy zanedbat) třeba regulárem, který bude hledat zhruba toto:
sekvence a-z0-9 následovaná tečkou následovaná max. 4 znaky a-z

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: