Diskuse JPW: Práce s velkým množství dat při analýze klíčových slov

	Autor	Zpráva
	Jakub Loskot Profil	#1 · Zasláno: 19. 3. 2013, 15:19:06 Odpovědět Citovat Dobrý den, mám 3 tabulky vyhledávaných dotazů (výsledky z Analytics, Adwords a Sklik), některé mají i několik tisíc dotazů. Potřeboval bych poradit s nějakým nástrojem na jejich efektivní správu a práci. Na začátek bych třeba potřeboval vymazat duplicitní dotazy (takže je nějak najít ve vyhledávači a smazat je), pak třeba všechny 3 tabulky spojit a zarovnat dle abecedy nebo je seřadit dle počtu prokliků atd. Prostě takové a podobné práce s dotazy.
	scheras Profil *	#2 · Zasláno: 19. 3. 2013, 18:20:17 Odpovědět Citovat Koukněte se na SQL příkazy JOIN (a podskupinu), dále ORDER BY a WHERE.
	Jakub Loskot Profil	#3 · Zasláno: 19. 3. 2013, 18:24:33 Odpovědět Citovat díky moc. Už si hraju s Google Refine, opravdu silný nástroj.
	Marek Prokop Profil	#4 · Zasláno: 19. 3. 2013, 21:35:11 Odpovědět Citovat Google Refine a pár dalších nástrojů doporučuji na konci tohoto článku: http://vyhledavace.info/clanky/246/klasifikacni-analyza-klicovych-slov
	Jakub Loskot Profil	#5 · Zasláno: 19. 3. 2013, 23:38:40 · Upravil/a: Jakub Loskot 20. 3. 2013, 02:23:35 Odpovědět Citovat Marek Prokop: právě díky tomu článku jsem našel Refine, takže díky moc. V článku jste se také zmínil, že byste o Refine napsal nějaký článek. Plánujete ho? Myslím, že by se moc hodil.
	Martin Kolčaba Profil	#6 · Zasláno: 20. 3. 2013, 07:32:59 · Upravil/a: Martin Kolčaba o minutu později Odpovědět Citovat Jakub Loskot Určitě Refine, ale část z věcí, které píšeš, by uměl řešit i Excel, případně Libre Office Calc, nebo snad i Google Spreadsheets. Teď mám na mysli ty duplicitní dotazy, zarovnání dle abecedy / počtu hledání apod. Marek Prokop: Přikláním se k Jakubovi, to video o Refine by se hodilo. Sice jsem se s ním už naučil pracovat poměrně dobře hlavně díky radám Martina Šimka, ale přesto cítím, že tu mám mezery. Video by se výborně hodilo jako doplnění článku o klasifikační analýze... :)
	Cody Profil	#7 · Zasláno: 20. 3. 2013, 07:36:22 Odpovědět Citovat Marek Prokop: Marku nenech se přemlouvat, prosím:-)
	Marek Prokop Profil	#8 · Zasláno: 20. 3. 2013, 15:28:16 Odpovědět Citovat Martine, workshop na Refine mám na LIMu, tak ho tam uvidíš :-)
	Martin Kolčaba Profil	#9 · Zasláno: 20. 3. 2013, 22:03:49 Odpovědět Citovat Marek Prokop: no tak výborně! :)
	Jakub Loskot Profil	#10 · Zasláno: 20. 3. 2013, 23:36:30 Odpovědět Citovat Martin Kolčaba: Martine, jen takový technický dotaz. Pokud dám v Refine seskupení dat podobné hodnoty pomocí "Cluster and edit" a následně "key collision", nepostřehl jsem, jestli se počet vyhledávaných dotazů automaticky sečte do toho jednoho výsledného dotazu, uvedu příklad: Mám slova: Tábor 5 tabor 3 taabor 2 po zvolení seskupení do "Tábor", bude mít výsledný počet vyhledávání 10 nebo stále 5?
	Marek Prokop Profil	#11 · Zasláno: 21. 3. 2013, 00:02:10 Odpovědět Citovat Jakube, Refine nic nesčítá. Hledanost je potřeba sečíst následně kontingenční tabulkou v nějakém spreadsheetu.
	Jakub Loskot Profil	#12 · Zasláno: 21. 3. 2013, 00:19:53 Odpovědět Citovat Marek Prokop: Děkuji. Takže technicky si mám najít, která slova se mi spojila a ty výrazy najít a sečíst jejich hodnoty?
	Marek Prokop Profil	#13 · Zasláno: 21. 3. 2013, 00:33:35 Odpovědět Citovat Není potřeba nic spojovat. Ke slovům Tábor, tabor a taabor se přidá druhý sloupec ve kterém bude u všech normalizovaný tvar tábor. Podle něj to pak spreadsheet posčítá. Aspoň tak s tím pracuju já, ale možná to jde i jinak.
	Jakub Loskot Profil	#14 · Zasláno: 21. 3. 2013, 00:36:59 · Upravil/a: Jakub Loskot o okamžik později Odpovědět Citovat Marek Prokop: ano, vlastně tam je ten sloupec s normalizovaným výrazem, pravda. Děkuji.
		Časová prodleva: 8 měsíců
	Filip Podstavec Profil	#15 · Zasláno: 18. 11. 2013, 18:40:33 · Upravil/a: Filip Podstavec o 13 minut později Odpovědět Citovat Marek Prokop & Jakub Loskot: Trochu pozdě, ale přece - Jakube nemusíte vytvářet kontingenční tabulku, data se dají jednoduše sečíst přímo v OpenRefine. Krokový návod: - Po clusterizaci seřaďte data podle názvu - Edit cells -> Blank down - U sloupců s hodnotami: Edit cells -> Join multivalued cells - Poté u daných sloupců: Edit cells -> Transform a zde vložte: forEach(value.split(‚,’),v,v.toNumber()).sum() A je hotovo. Kdybyste s tím měl jakýkoli problém, dejte vědět. Filip Podstavec
		Časová prodleva: 10 let

Vaše odpověď

Mohlo by se hodit