Autor Zpráva
josh
Profil *
Zdravim,

skusal som hladat a nic podobne som zatial nenasiel.


Potreboval by som skript (najlepsie co uplne najjednoduchsi) na zistenie <TITLE> tagov, resp nazvu zadanej webstranky. Tiez by bolo fajn keby informacie o 'Title' vyustili do premennej, myslim napr. $titlevalue (nie len vypis echom).


A tiez by som sa chcel spytat ci exituje nejaka postupnost prikazov alebo samotny skript na odcitanie obsahu zo zadanej webstranky.


Za odpovede voprde Dakujem
Chamurappi
Profil
Reaguji na joshe:
get website Title & Content ?
Viz závazná pravidla:
1. Pište česky nebo slovensky. Nutné anglické citace pokud možno překládejte.
2. Pište s háčky a čárkami. Delší text rozdělte do odstavců. Používejte větnou interpunkci.
Nedodržováním pravidel snižuješ šanci na správnou odpověď. Špatně nadepsaný dotaz bude špatně dohledatelný.

Já bych to v ASP.NET udělal tak, že bych si stáhnul stránku třeba metodou WebClient.DownloadString a titulek bych našel v prvním Capture v první Group v prvním Matchi na regulární výraz „<title>(.*?)</title>“ při RegexOptions.Singleline | RegexOptions.IgnoreCase. Vyzobnutí obsahu by bylo složitější, protože bych měl zohledňovat, které elementy jsou blokové a které řádkové, aby se mi nestekla dohromady slova, která jsou vizuálně oddělená, a naopak, aby se nerozdělila slova, v nichž je část obalená řádkovými elementy. Před tím vším bych musel ještě zjistit kódování. Část těchto úkonů by asi usnadnila třída SgmlReader.

Za odpovede voprde Dakujem
Rádo se stalo, voprde :-)

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: