Autor | Zpráva | ||
---|---|---|---|
xtrip Profil |
#1 · Zasláno: 9. 3. 2011, 15:51:55
Ahojte, potřeboval bych poradit, mam v souboru url.txt 100 url na web stránky. jsou seřazeny pod sebou. Problém je vtom, že jsou "osazeny" html tagy ato: <cite>www.stranky.tld/<b>index.php</b>?<b>blabla=bla</b>&sort...</cite> a funkcí strip_tags() odstraním všechny tagy. Mím cílém je ale dostat samotnou adresu www.stranky.tld. Nevítě někdo, jestli existuje nějakéj script ať už php či javascript nebo perl? díky za odpovědi :)
|
||
Tori Profil |
#2 · Zasláno: 9. 3. 2011, 15:59:15
Pokud má ten soubor jednotný formát jednotlivých řádků, tak by je šlo vyzobat regulárem (preg_match / preg_match_all v PHP).
|
||
xtrip Profil |
#3 · Zasláno: 9. 3. 2011, 16:02:39
ano ma ... radek(enter)radek(enter) atp ...
|
||
xtrip Profil |
#4 · Zasláno: 9. 3. 2011, 16:14:18
vypada to takto:
$text = '<cite>www.server.com/<b>index.php</b>?<b>a=registered</b>&sort...</cite> <cite>www.server.com/<b>index.php</b>?<b>a=registered</b></cite> <cite>www.server.com/<b>index.php</b>?<b>a=registered</b>&page=1...</cite> <cite>www.server.com/<b>index.php</b>?<b>a=registered</b>&sort...</cite> <cite>www.server.com/<b>index.php</b>?<b>a=registered</b>&sort...</cite> <cite>www.server.com/<b>index.php</b>?<b>a=registered</b>&sort...</cite> <cite>www.server.com/<b>index.php</b>?<b>a=registered</b>&sort...</cite> <cite>www.server.com/<b>index.php</b>?<b>a=registered</b>&sort...</cite>"; na každém řádku je jina adresa a někdy je konec url (&sort..) také jiný. potřebuji jen www.server.com/ ze všech řádku ... koukám na zmiňované fce a pochybuji |
||
Tori Profil |
#5 · Zasláno: 9. 3. 2011, 16:55:27 · Upravil/a: Tori
Pokud se dá spoléhat na to <cite> na začátku, tak bych načetla celý soubor do proměnné (bez vyhazování tagů) a vytáhla adresy takto:
preg_match_all('~<cite>((http://)?[^/]+)~i', $text, $vysledky); |
||
xtrip Profil |
#6 · Zasláno: 9. 3. 2011, 20:06:01
výsledek je jen "Array"
|
||
Radek9 Profil |
#7 · Zasláno: 9. 3. 2011, 20:23:47
xtrip:
To bude tím, že je to pole… |
||
xtrip Profil |
#8 · Zasláno: 9. 3. 2011, 20:30:45
ano, echo $vysledek[1]; ... vyledek je Arry
|
||
Časová prodleva: 13 let
|
0