Autor Zpráva
Jakub Loskot
Profil
Dobrý den,
mám 3 tabulky vyhledávaných dotazů (výsledky z Analytics, Adwords a Sklik), některé mají i několik tisíc dotazů. Potřeboval bych poradit s nějakým nástrojem na jejich efektivní správu a práci. Na začátek bych třeba potřeboval vymazat duplicitní dotazy (takže je nějak najít ve vyhledávači a smazat je), pak třeba všechny 3 tabulky spojit a zarovnat dle abecedy nebo je seřadit dle počtu prokliků atd. Prostě takové a podobné práce s dotazy.
scheras
Profil *
Koukněte se na SQL příkazy JOIN (a podskupinu), dále ORDER BY a WHERE.
Jakub Loskot
Profil
díky moc.

Už si hraju s Google Refine, opravdu silný nástroj.
Marek Prokop
Profil
Google Refine a pár dalších nástrojů doporučuji na konci tohoto článku: http://vyhledavace.info/clanky/246/klasifikacni-analyza-klicovych-slov
Jakub Loskot
Profil
Marek Prokop:

právě díky tomu článku jsem našel Refine, takže díky moc.
V článku jste se také zmínil, že byste o Refine napsal nějaký článek. Plánujete ho? Myslím, že by se moc hodil.
Martin Kolčaba
Profil
Jakub Loskot
Určitě Refine, ale část z věcí, které píšeš, by uměl řešit i Excel, případně Libre Office Calc, nebo snad i Google Spreadsheets. Teď mám na mysli ty duplicitní dotazy, zarovnání dle abecedy / počtu hledání apod.

Marek Prokop:
Přikláním se k Jakubovi, to video o Refine by se hodilo. Sice jsem se s ním už naučil pracovat poměrně dobře hlavně díky radám Martina Šimka, ale přesto cítím, že tu mám mezery. Video by se výborně hodilo jako doplnění článku o klasifikační analýze... :)
Cody
Profil
Marek Prokop:
Marku nenech se přemlouvat, prosím:-)
Marek Prokop
Profil
Martine, workshop na Refine mám na LIMu, tak ho tam uvidíš :-)
Martin Kolčaba
Profil
Marek Prokop:
no tak výborně! :)
Jakub Loskot
Profil
Martin Kolčaba:

Martine, jen takový technický dotaz. Pokud dám v Refine seskupení dat podobné hodnoty pomocí "Cluster and edit" a následně "key collision", nepostřehl jsem, jestli se počet vyhledávaných dotazů automaticky sečte do toho jednoho výsledného dotazu, uvedu příklad:
Mám slova:

Tábor 5
tabor 3
taabor 2

po zvolení seskupení do "Tábor", bude mít výsledný počet vyhledávání 10 nebo stále 5?
Marek Prokop
Profil
Jakube, Refine nic nesčítá. Hledanost je potřeba sečíst následně kontingenční tabulkou v nějakém spreadsheetu.
Jakub Loskot
Profil
Marek Prokop:

Děkuji.
Takže technicky si mám najít, která slova se mi spojila a ty výrazy najít a sečíst jejich hodnoty?
Marek Prokop
Profil
Není potřeba nic spojovat. Ke slovům Tábor, tabor a taabor se přidá druhý sloupec ve kterém bude u všech normalizovaný tvar tábor. Podle něj to pak spreadsheet posčítá. Aspoň tak s tím pracuju já, ale možná to jde i jinak.
Jakub Loskot
Profil
Marek Prokop:

ano, vlastně tam je ten sloupec s normalizovaným výrazem, pravda. Děkuji.
Filip Podstavec
Profil
Marek Prokop & Jakub Loskot:
Trochu pozdě, ale přece - Jakube nemusíte vytvářet kontingenční tabulku, data se dají jednoduše sečíst přímo v OpenRefine. Krokový návod:
- Po clusterizaci seřaďte data podle názvu
- Edit cells -> Blank down
- U sloupců s hodnotami: Edit cells -> Join multivalued cells
- Poté u daných sloupců: Edit cells -> Transform a zde vložte:
forEach(value.split(‚,’),v,v.toNumber()).sum()

A je hotovo. Kdybyste s tím měl jakýkoli problém, dejte vědět.

Filip Podstavec

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: