Autor Zpráva
Pavel Dumbrovský
Profil
Dobrý den,
prosím nevíte někdo o skriptu/programu/službě , která by dokázala ze zadaného umístění sesbírat e-mailové adresy a ideálně procházet daný server jako robot vyhledávačů?

Díky.
Mároš
Profil
Z toho nevěštím nic dobrého :)) Ale co, moje věc to nakonec není :)
V PHP bych si udělal CURL script, který by prošel onu webovku a nějakým regulárním výrazem si uložil mejly. Možná bych to ještě nastavil cronem třeba na každou hoďku, aby to bylo pěkně aktualizovaný :)
peta
Profil
http://cz.php.net/file_get_contents (nebo klasicky pres file)
Example #1 Get and output the source of the homepage of a website
<?php
$homepage = file_get_contents('http://www.example.com/');
echo $homepage;
?>

http://cz.php.net/manual/en/function.preg-replace-callback.php
Example #2 preg_replace_callback() example
<?php
// this text was used in 2002
// we want to get this up to date for 2003
$text = "April fools day is 04/01/2002\n";
$text.= "Last christmas was 12/24/2001\n";
// the callback function
function next_year($matches)
{
  // as usual: $matches[0] is the complete match
  // $matches[1] the match for the first subpattern
  // enclosed in '(...)' and so on
  return $matches[1].($matches[2]+1);
}
echo preg_replace_callback(
            "|(\d{2}/\d{2}/)(\d{4})|",
            "next_year",
            $text);

?>

A pak uz jen spravny regularni vyraz a propojit to. Ten vyraz by mohl byt neco jako
'/([\s\"\']*?@[\s\"\']*?)/' (mozna zdvojit, ztrojit nektere lomitko)
cili, vse, co neni mezera, dvojity apostrof a apostrof opakuj po zavinac. A po zavinaci opakuj, dokud nenarazis na mezeru, apostrof nebo dvojity apostrof.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: