Autor | Zpráva | ||
---|---|---|---|
juraj Profil |
#1 · Zasláno: 30. 6. 2012, 12:02:40
Zdravim
nevie niekto poradiť,alebo naznačiť aký použiť kod,ked chcem napr. z nejakej ľubovolnej domene načítať všetky odkazy do textového súboru? dakujem za navrhy ,nemám na mysli nejaké online generátory alebo programy s pozdravom juraj |
||
Keeehi Profil |
#2 · Zasláno: 30. 6. 2012, 12:29:33
A co máš tedy na mysli? S HTML to nepůjde. Pokud chceš použít PHP, tak proč to není v sekci PHP?
<?php preg_match_all('~<a .*?href="?\'?(.*?)["\'> ]~',file_get_contents("http://example.com"),$match); file_put_contents("soubor.txt",implode("\n", $match[1])); |
||
juraj Profil |
#3 · Zasláno: 30. 6. 2012, 12:48:41
Keeehi:
Ďakujem,ja by som potreboval, aby všetky odkazy stiahlo,nie len tie,ktoré sa nachádzajú na hlavnej stránke, ale aj tie čo sú,stránkované, na page1,page2.... Ďakujem |
||
juriad Profil |
#4 · Zasláno: 30. 6. 2012, 13:02:10
pokud ti nevaďi zavolat jiný program, tak se pro rekurzivní stahování podivej na nástroj wget a přepínač -r
|
||
Keeehi Profil |
Toto řeší stránkování:
$page = 1 $headers = get_headers("http://example.com/page$page"); while($headers[0] == "HTTP/1.1 200 OK") { preg_match_all('~<a .*?href="?\'?(.*?)["\'> ]~',file_get_contents("http://example.com/page$page"),$match); file_put_contents("soubor.txt",implode("\n", $match[1]),FILE_APPEND); $page++; $headers = get_headers("http://example.com/page$page"); } |
||
juraj Profil |
#6 · Zasláno: 30. 6. 2012, 15:31:59 · Upravil/a: juraj
Keeehi:
nefunguje,to strankovanie vypysuje hlasku Warning: get_headers(http://www.onlineinzercia.com/page=1) [function.get-headers]: failed to open stream: HTTP request failed! HTTP/1.1 404 Not Found in D |
||
Keeehi Profil |
#7 · Zasláno: 30. 6. 2012, 18:00:38
A zkoušel jste ji adresu
http://www.onlineinzercia.com/page=1 zadat do prohlížeče? Nic tam není, tak se nedivte.
|
||
Chro Profil |
#8 · Zasláno: 30. 6. 2012, 18:24:29
juraj:
Page je GET parametr, ne název souboru. Tudíž by měl být oddělen otazníkem. www.domena.com/?page=3
|
||
Keeehi Profil |
#9 · Zasláno: 30. 6. 2012, 18:33:34
Chro:
To se nedá takto obecně říct i když ve většině případů je to pravda. S použitím mod_rewrite by to hlidně mohlo být třeba ve tvaru http://www.onlineinzercia.com/1 .
Obecné řešení: Projít si několik stránek, zjistit co se tam mění, celou adresu zkopírovat a na tom místě, kde se to měnilo nahradit za $page. |
||
Chro Profil |
#10 · Zasláno: 30. 6. 2012, 18:47:41
Keeehi:
Pravdu máš, já myslel co se týče tohoto případu. Mod rewrite nemá s ním nic společného, Řešil jsem překlep v adrese ve skriptu. |
||
Keeehi Profil |
#11 · Zasláno: 30. 6. 2012, 22:27:27
Chro:
To bylo spíše pro ty, kteří by řešili někdy později podobný problém, ale měli by co dočinění s nějakou seo adresou. |
||
Časová prodleva: 12 let
|
0