Autor Zpráva
Pavlínka
Profil
doposud jsem odkazy z textu odstraňovala docela ošklivým způsobem...
nyní jsem se ale setkala s tím, že se v textu objevuje více odkazů a často mění tvar (například různě proházené target, href a class nebo neukončený element)

ráda by jsem tedy poprosila o radu
jak z textu odstranit odkaz tak aby text odkazu zůstal pouze jako text? (pomocí PHP)
upozorňuji, že nechci odstraňovat všechny HTML znaky, pouze odkaz :)
pro mě zatím neřešitelný problém :D



text: mladý muž odkázal na <a href="">odkaz</a> svého dědy
nebo: mladý muž odkázal na <a href="">odkaz svého dědy
nebo: mladý muž odkázal na <a id="">odkaz</a> svého dědy
nebo: mladý muž odkázal na <a class="" href="">od<b>kaz</a> svého dědy
výsledek: mladý muž odkázal na odkaz svého dědy
Bubák
Profil
Pokud by stačilo by jen znefunkčnění odkazu, tak jse nahradit (bez ohledu na velikost písmen) href třebas za neodkaz. Nevýhodou je, že ve zdrojáku je odkaz k nalezení.
mladý muž odkázal na <a neodkaz="">odkaz</a> svého dědy

Obecně, možná na zcela přesně:
odkaz je element a s atributem href
uvozovky nebo apostrofy jsou za určitých okolností nepovinné, ale prohlížeče jsou mnohem tolerantnější href=https://www.jakpsatweb.cz/
můžou tam být bílé znaky href = "https://www.jakpsatweb.cz/"
Tomášeek
Profil
Pavlínka:
Prostuduj si regulární výrazy. Počáteční tag má regulární v tomto znění (<a[cokoliv kromě >, a to jakýkoliv počet znaku a cele navíc volitelně]>), konec pak je obyčejné nahrazeni </a> za prázdný string. To volitelně znamená, ze to vezme i proste <a>.

Uvádím záměrně jen slovní podobu, regular není složitý. Aspoň si něco přečtěs a naucis. Z předchozích dotazu mám pocit, ze jsi jen líný se snažit.
Keeehi
Profil
No a mladý muž odkázal na <b onclick="document.location.href = 'https://www.seznam.cz'">odkaz</b> svého dědy ti nevadí?
Jestli tohle má být ošetřování uživatelských vstupů tak to není úplně šťastné řešení. Těžko sama přijdeš na všechny způsoby, jak do kódu propašovat něco nebezpečného. Použij na formátování něco osvědčeného (markdown, bbcodes, ...) ale nenechávej uživatele používat přímo HTML.
Pavlínka
Profil
Tomášeek:
problém je v tom, že element </a> tam občas není :D
takže všechny řešení co píšete jsou k ničemu... :( proto sjem psala více příkladů...
doposud jsem to řešila takovým kostrbatým reg. výrazem ale když tam není ukončený tag tak mi nefunguje

Keeehi:
jde o mé "api" z csfd... takovýto výraz se tam nikde neobjevuje :)
Bubák
Profil
Pavlínka:
problém je v tom, že element </a> tam občas není :D
Já v tom problém nevidím. Pokud už tam koncová značka není, tak to je totéž, jako bys tam už ve [#3] zmíněný prázdný string měla.

Tomášeek:
Trochu by to chtělo vylepšít, jinak to bude brát i ABBR, ACRONYM, ADDRESS...
(<a bílý znak [cokoliv kromě >, a to jakýkoliv počet znaku a cele navíc volitelně]>) nahradít za prázdný string.
Tomášeek
Profil
Bubák:
Tyto možnosti jsou zahrnuty v tom, co jsem psal. Buď <a>, nebo <a mezera cokoliv krom uzavírací závorky>. Mas pravdu, ze mezeru jsem na tabletu při formátování umazal. S trochou citu se ji dá dovtipit.


Pavlínka:
ČSfd api nemá. Vykradani dat je trestné a nemělo by ti tu s nim být napomahano. Mmm
Pavlínka
Profil
Tomášeek:
asi nemělo.. ale je to pro soukromé účely (resp. rodinu) tak na tom nic špatného až tak nevidím :)
ostatně spousta webů zbrazuje % hodnocení od CSFD
mckay
Profil
Tomášeek:
Vykradani dat je trestné
Jen tak ze zvědavosti, vzhledem k tomu, že to tu v poslední době zmiňuje pořád někdo dokola. V tomto konkrétním případě - přečtení veřejně přístupných dat a jejich replikace jinde - dle jakých právních základů se poškozované CSFD bude soudit? Co takovému pachateli hrozí a na základě čeho? Pokud to bude možné, tak prosím bez zohledňování osobních etických a morálních zásad, hlavně ty zákony, postih, případně i nějaké již proběhlé soudní spory.
Edit, a ještě jsem si všiml, že byl přivoláván moderátor. Pokud je standardní proces, že se tyhle téma dávají k ledu a pak mažou, pak bych rád i nějaký pohled od moderátora. :)
Tomášeek
Profil
mckay:
Projdi si Autorský zákon, bude tě zajímat „Neoprávněné vytěžování databáze“. Proběhlé soudní spory a možné tresty nesleduji, asi půjde obojí dohledat.

Každopádně, i kdyby zatím žádný soud neproběhl, nedává to nikomu právo databázi bez oprávnění vytěžovat (mimo užití definované v platných zákonech, tam bude nějaká osobní potřeba, atd.). Otázka je, jak v případném soudním sporu vyčíslit škodu, ale minimálně pořízení a udržování databáze (konkrétně ČSFD) nebylo úplně levné, a volným vykradením dat by ostatní subjekty tyto náklady neměly.
mckay
Profil
Tomášeek:
Díky!

TL;DR pro ostatní, dle mého pochopení (s ručením omezeným): Člověk (entita), která si databázi pořídila má nárok na dvojnásobek částky, za kterou by udělovala přístup k databázi na základě uzavření smlouvy (pokud firma nenabízí licenci, posuzováno a ohodnocováno v rámci soudního řízení expertem). To tedy ale pouze v případě, že se prokáže, že pachatel replikoval (zpřístupnil) kvalitativně či kvantitativně podstatnou část databáze. Výklad toho, co to ztučněné znamená je opět posuzováno v rámci soudního sporu a může být problematické dokázat. Rozlišuje se tam taky kontext toho, v jakém ty data byla zpřístupňována/replikována (osobní použití v rámci rodiny by nejspíš zůstalo pod radarem).

Teď bych se vrátil k té morální a etické části věci. Tazatelka řeší obecný technický problém, který by mohlo ocenit více lidí, v legitimních kontextech. Později se ukáže, že tazatelka je možná v oblasti nelegitimního použití. Co teď navrhujete aby se s dotazem stalo, popřípadě, jak se k tomu jako moderátoři stavíte?
Tomášeek
Profil
mckay:
Tazatelka řeší obecný technický problém, který by mohlo ocenit více lidí, v legitimních kontextech.
Já (z pohledu nemoderátora) bych to viděl asi takhle: dotaz mířící k nepovolenému vykrádání smazat a tazatele nechat upadnout v zapomnění. Další dotaz s čistou právní kvalifikací dalšímu tázajícímu zodpovědět, pokud už tu podobný zopodvězený dotaz z dřívějška nebude (ten samozřejmě zůstane do budoucna nalezitelný všem, ale to už kontrolovat nejde).

Ono jde i o to, že spousta služeb má API, a tak spousta dobře míněných dotazů může skončit odpovědí "Tebou poptaná služba má takové a takové API, tady je k němu dokumentace a tvůj konkrétní problém se řeší tak a tak". Žádné spoléhání na nezměněný markup a dolování dat z file_get_contents tak nebude muset nastat.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0