Autor Zpráva
benett
Profil
V PHP skriptu potřebuju získat informace z PDF souborů. Je na to nějaká osvědčená metoda?
Zatím mě napadá buď instalace něčeho typu Xpdf, PDFlib nebo využití výstupu nějaké online služby jako FileFormat ( nevím, jak komplikované bude zachycení výstupu+ nemusí to být spolehlivé...).
Ugo
Profil
tady mam nespolehlivou fci na čtení streamu, záleží na tom co potřebuješ za pdfka, jestli některé tvoje tak je postačující vědět, že mezi varianty streamu patří mimo jiné i lehký plain text a nebo gz komprese. (novější verzi s regulárem sem nenašel, snad tohle fachá aspoň trochu :) ) na složitější parsování FTP jsme nepřišli nějak jednoduše, ale pokud se nebojíš věcí jako xpdf (já vůbec nevím jak s tím naložit), tak to je cesta.

header("Content-Type: text/html; charset=windows-1250");
		$file=file_get_contents("new 4.pdf");
		$x=explode("endstream",$file);
		foreach($x as $val) {
			$val=explode("stream",$val);
			$val=$val[1];
			$val=ltrim($val);
			$val=rtrim($val);
			echo (@gzuncompress($val)? gzuncompress($val):$val)
			//d(gzuncompress($val));
		}
benett
Profil
Tento jednoduchý způsob bohužel nefunguje, prostuduju ty knihovny.

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0