Diskuse JPW: Vytáhnout data z tabulek pomocí preg_match

	Autor	Zpráva
	capricorn76 Profil *	#1 · Zasláno: 22. 3. 2013, 16:05:14 Odpovědět Citovat Zdravím, Struktura tabulek: 1. <table>, <tr>, <td>, <th> obsahují značky, které NEUKLÁDAT 2. alepsoň jedna buňka na RŮZNÉM místě v řádku MUSÍ obsahovat dvě VELKÁ písmena, které ULOŽIT. Pokud neobsahuje, tak nic z toho řádku NEUKLÁDAT 3. povolené znaky buněk: desetinná čísla (oddělovač je,.), čísla a písmena, mezera 4. počet buněk se někdy liší 5. např. <td><p style="..">obsah</td> nebo <th><span ...>obsah</span></th> apod., ULOŽIT obsah, tagy NEUKLÁDAT Děkuji za pomoc.
	Virtus Profil	#2 · Zasláno: 22. 3. 2013, 17:14:46 · Upravil/a: Virtus o 5 minut později Odpovědět Citovat Myslím, že pro načtení toho HTML kódu by se dalo použít toto: Document Object Model, a pak už by stačilo jenom nějakým cyklem procházet jednotlivý řádky a dalším cyklem uvnitř, procházet buňky, kde by si přes if a regulár kontroloval, jestli obsah buňky obsahuje dvě velká písmena a když bys zjistil, že obsahuje, rovnou uložíš celej řádek, vyskočíš z cyklu pro procházení buněk a jdeš na další řádek. if pro kotrnolu dvou velkých písmen by mohl potom vypadat asi takhle: if(preg_match('/^.[A-Z]{1}.[A-Z]{1}.*$/', $obsahBunky))
	capricorn76 Profil *	#3 · Zasláno: 22. 3. 2013, 19:10:59 Odpovědět Citovat Děkuji. if(preg_match('/^.[A-Z]{1}.[A-Z]{1}.$/', $obsahBunky)) tohle nefunguje, když mám v $obsahBunky např. <td>AB</td> Zkusil jsem to změnit na if(preg_match('/^.[A-Z]{}.$/', $obsahBunky)) ale to také nefunguje . pokud to dobře chápu, tak tohle bere <td> i <th>
	Virtus Profil	#4 · Zasláno: 22. 3. 2013, 19:28:04 · Upravil/a: Virtus o 9 minut později Odpovědět Citovat `.*` tohle je regulérní výraz pro jaký koliv string a to i prázdný tečka = jakej koliv znak hvězdička = že těch znaků může být nula až nekonečno A příde mi divný, že Vám ten můj regulár nefunguje na AB, testoval jsem ho tady: preg_match() online a AB řetězec mi prošel, zkuste si vypsat obsah té proměnné $obsahBunky, jestli v ní opravdu máte string AB
	Jan Tvrdík Profil	#5 · Zasláno: 22. 3. 2013, 19:28:23 · Upravil/a: Jan Tvrdík o 3 minuty později Odpovědět Citovat capricorn76: Ověření, že daný řetězec obsahuje alespoň dvě velká písmena: $s = 'fooAbarB'; $valid = (bool) preg_match('#(?:[A-Z].*){2}#', $s); var_dump($valid);
	capricorn76 Profil *	#6 · Zasláno: 22. 3. 2013, 20:02:37 Odpovědět Citovat Virtus: Jan Tvrdík: „zkuste si vypsat obsah té proměnné“ proměnná obsahuje <td>nějaký obsah</td> tedy projde i 'fooAbarB', což je špatně, protože jsem prvotní příspěvek napsal špatně. I když $obsahBunky bude 'fooAbarB', tak to musí být false, i když řetězec obsahuje 2 velká písmena a ostatní jsou malá. Chci jen řádky kde jsou pouze 2 velká písmena, t.j. 'fooAbarB' = false, 'DS' = true zkusil jsem tedy, aby to bralo <tag> if(preg_match('/^<.?[A-Z]{2}.?>$/', $obsahBunky)) ale pořád to není ono
	Virtus Profil	#7 · Zasláno: 22. 3. 2013, 20:07:16 · Upravil/a: Virtus o 5 minut později Odpovědět Citovat if(preg_match('/^\<td\>([A-Z]{2})\<\/td\>$/', $obsahBunky, $match )) //v $match[1] budu mít jenom ty dvě velká písmena, pokud Vám jde pouze o ně
	capricorn76 Profil *	#8 · Zasláno: 22. 3. 2013, 20:20:03 Odpovědět Citovat Virtus: „v $match[1] budu mít jenom ty dvě velká písmena, pokud Vám jde pouze o ně“ nejde mně o $match[1], ale potřebuji upravit if(preg_match('/^<.?[A-Z]{2}.?>$/', $obsahBunky)) aby podmínka se vyhodnocovala takto <td>'fooAbarB</td> = false <th>'fooAbarB</th> = false <td>BC</td> = true <th>FC</th> = true
	Virtus Profil	#9 · Zasláno: 22. 3. 2013, 20:24:50 · Upravil/a: Virtus o 13 minut později Odpovědět Citovat preg_match('/^\<(t\|T){1}(d\|D\|h\|H){1}\>[A-Z]{2}\<\/(t\|T){1}(d\|D\|h\|H){1}\>$/', $obsahBunky) Projde tím ovšem i něco takového: <td>AB</th> Tady v tom případě, už projdou striktně jenom: preg_match('/^\<((t\|T){1}(d\|D){1}\>([A-Z]{2})\<\/(t\|T){1}(d\|D){1}\|(t\|T){1}(h\|H){1}\>([A-Z]{2})\<\/(t\|T){1}(h\|H){1})\>$/', $obsahBunky); <td>AB</td> <th>AB</th> <td>AB</th> neprojde A pokud jste si jistý, že vždy budete mít tagy s malými písmeny, tj. <td><th>, můžete ten regulár zkrátit na tohle: preg_match('/^\<(td\>([A-Z]{2})\<\/td\|th\>([A-Z]{2})\<\/th)\>$/', $obsahBunky);
	capricorn76 Profil *	#10 · Zasláno: 22. 3. 2013, 21:00:35 Odpovědět Citovat Virtus: „preg_match('/^\<(td\>([A-Z]{2})\<\/td\|th\>([A-Z]{2})\<\/th)\>$/', $obsahBunky);“ Skvělé, ale nefunguje to, když buňky mají class, style apod.
	Virtus Profil	#11 · Zasláno: 22. 3. 2013, 21:11:24 Odpovědět Citovat Tak přidáme malou úpravu s .: preg_match('/^\<(td.\>([A-Z]{2})\<\/td\|th.*\>([A-Z]{2})\<\/th)\>$/', $obsahBunky);
	capricorn76 Profil *	#12 · Zasláno: 22. 3. 2013, 21:25:23 Odpovědět Citovat Virtus: Super, děkuji.
	capricorn76 Profil *	#13 · Zasláno: 22. 3. 2013, 23:16:17 Odpovědět Citovat Virtus: potřeboval bych ještě prosím upravit ten regulár, aby fungoval kdekoli v řádku, protože teď funguje jen jako první. Děkuji.
	Virtus Profil	#14 · Zasláno: 22. 3. 2013, 23:39:03 · Upravil/a: Virtus o 4 minuty později Odpovědět Citovat tak opět přidáme ., na kraje celého reguláru: preg_match('/^.(\<(td.\>([A-Z]{2})\<\/td\|th.\>([A-Z]{2})\<\/th)\>).*$/', $obsahBunky);
	capricorn76 Profil *	#15 · Zasláno: 23. 3. 2013, 11:43:12 Odpovědět Citovat Virtus: Děkuji, ještě bych potřeboval doplnit bílé znaky na začátku, uprostřed, na konci.
	Virtus Profil	#16 · Zasláno: 23. 3. 2013, 13:06:15 · Upravil/a: Virtus o 10 minut později Odpovědět Citovat \s = "bílé" znaky (mezera, tabulátor, znaky pro zalomení řádků) preg_match('/^.(\<(td.\>\s[A-Z]{1}\s[A-Z]{1}\s\<\/td\|th.\>\s[A-Z]{1}\s[A-Z]{1}\s\<\/th)\>).$/', $obsahBunky); Př. které projdou: 1)<td> AB</td> 2)<td>AB </td> 3)<td> AB </td> 4)<td> A B </td> 5)<td>AB</td> Tady: Regulární výrazy, jsou česky popsané základy regulárních výrazu, pomocí nich se dá udělat všechno, nenapadá mně žádný řetězec který by snimi(se základy) nešel popsat. Další informace i trochu složitější věci pak najdete v článcích na interval.cz
		Časová prodleva: 13 let

0