Diskuse JPW: get website Title & Content?

	Autor	Zpráva
	josh Profil *	#1 · Zasláno: 4. 1. 2010, 18:09:12 · Upravil/a: Moderátor (editace znemožněna) Odpovědět Citovat Zdravim, skusal som hladat a nic podobne som zatial nenasiel. Potreboval by som skript (najlepsie co uplne najjednoduchsi) na zistenie <TITLE> tagov, resp nazvu zadanej webstranky. Tiez by bolo fajn keby informacie o 'Title' vyustili do premennej, myslim napr. $titlevalue (nie len vypis echom). A tiez by som sa chcel spytat ci exituje nejaka postupnost prikazov alebo samotny skript na odcitanie obsahu zo zadanej webstranky. Za odpovede voprde Dakujem
	Chamurappi Profil	#2 · Zasláno: 4. 1. 2010, 18:34:22 Odpovědět Citovat Reaguji na joshe: „get website Title & Content ?“ Viz závazná pravidla: 1. Pište česky nebo slovensky. Nutné anglické citace pokud možno překládejte. 2. Pište s háčky a čárkami. Delší text rozdělte do odstavců. Používejte větnou interpunkci. Nedodržováním pravidel snižuješ šanci na správnou odpověď. Špatně nadepsaný dotaz bude špatně dohledatelný. Já bych to v ASP.NET udělal tak, že bych si stáhnul stránku třeba metodou WebClient.DownloadString a titulek bych našel v prvním Capture v první Group v prvním Matchi na regulární výraz „<title>(.?)</title>“ při RegexOptions.Singleline \| RegexOptions.IgnoreCase. Vyzobnutí obsahu by bylo složitější, protože bych měl zohledňovat, které elementy jsou blokové a které řádkové, aby se mi nestekla dohromady slova, která jsou vizuálně oddělená, a naopak, aby se nerozdělila slova, v nichž je část obalená řádkovými elementy. Před tím vším bych musel ještě zjistit kódování. Část těchto úkonů by asi usnadnila třída SgmlReader. „Za odpovede voprde Dakujem*“ Rádo se stalo, voprde :-)
		Časová prodleva: 16 let

Vaše odpověď

Mohlo by se hodit