Autor | Zpráva | ||
---|---|---|---|
ttkk Profil |
#1 · Zasláno: 18. 5. 2014, 21:01:41
Ahoj všem,
potřeboval bych poradit ohledně následujícího: V tuto chvíli mám data v excelovském souboru (vcelku větší množství dat - soubor má cca 35 MB). Tato data bych potřeboval analyzovat - vytvářet různé grafy a tabulky. V tuto chvíli celou analýzu provádím přímo v excelu za pomocí VBA a Kontingenčních tabulek. Nicméně je to takové krkolomné, a s přibývajícími měsíci poroste i velikost souboru - očekávám, že ke konci roku už by to mohlo být mezi 80 - 100 MB. Z tohoto důvodu se mi stávající řešení nelíbí. Pro uživatele časem přestane být pohodlné - zejména pomalé. Potřeboval bych vymyslet nějaké lepší řešení. Asi nejvíce by se mi líbilo vytvořit tuto analýzu online - prostřednictvím webových stránek s využitím databáze. Jako variantu B mám vytvoření desktopové aplikace, která by tato data analyzovala. Mé zkušenosti jsou zatím malé - zvládám jakž takž VBA, HTML - začátky, PHP - nic moc, JavaScript - začátky, SQL - vůbec. Nicméně rád se naučím jakýkoli programovací jazyk - čas mě zatím netlačí, navíc mě programování baví. V podstatě potřebuji poradit nejlepší / nejelegantnější řešení (v čem to celé udělat a co je třeba se kvůli tomu naučit). Hotovému řešení bych se raději vyhnul (tipům se ale nebráním), rád bych si to celé udělal sám. Omlouvám se za delší příspěvek... |
||
juriad Profil |
#2 · Zasláno: 18. 5. 2014, 21:19:48
Mám několik otázek:
Chceš vytvořit vizualizaci, na které můžeš sledovat vývoj dat? Chceš provádět jednoduchý náhled na data, nebo pokročilejší statistiku (například: korelace, nezávislost)? Budou ti stačit jen jednoduché funkce jako min, max, průměr, počet? Chceš mít možnost jednoduše provést ad-hoc dotaz? Jde ti o grafický výstup, či ti stačí jednoduchý výpis a pár grafů? Svěříš se jaké povahy jsou ta data? Co s nimi chceš dělat? Osobně bych to neřešil webovými nástroji, ale něčím k tomu určeným: R; z placených by to byla Matematika a Matlab. Ve všech těchto nástrojích se vlastně programuje, ale je to programování na pomezí matematiky (nejsou příliš třeba cykly, funkce). Délka příspěvku je fajn, alespoň to z tebe nemusíme dlouze tahat. |
||
Alphard Profil |
#3 · Zasláno: 18. 5. 2014, 21:34:44
Částečně naváži na juriada. Kdysi jsem si hrál s nasazením Octave (open source projekt velmi podobný vynikajícímu Matlabu) na VPS a přístupu k němu přes PHP. Je tam trochu problém směrovat data z databáze do Octave (dočasně a doteď :-) jsem to vyřešil přes soubory), ale zbytek funguje perfektně. Octave ušetří práci s výpočty (hodí se přesně na to, co jsem potřeboval) a výsledky jsem pak bez problémů exportoval a zobrazoval pomocí interaktivních javascriptových grafů.
|
||
ttkk Profil |
Ahoj, díky za reakce.
K upřesnění: - jedná se mi o jednoduchý náhled na data - pár grafů - koláčové, sloupcové, spojnicové (pár grafů znamená odhadem tak 20) - pár tabulek s vybranými daty (které budou fungovat velmi podobně jako Kontingenční v Excelu - co se týče nasčítávání hodnot). - jedná se o obchodní data (konkrétnější být nemohu, ale v podstatě úplně stejný princip, jako kdyby jste chtěli analyzovat skupinu např. 1000 pojišťováků a jejich obchodní výsledky - kolik prodal za měsíc celkem, rozdělení na jednotlivé produkty za měsíc, porovnání s plánem, trend apod...) - data jsou v tuto chvíli v excelu (xls), ale zřejmě by nebyl problém je uložit v příhodnějším formátu... - množství dat bude neustále narůstat - za rok počítám, že to dělá dohromady cca 100 - 150 MB (v tuto chvíli 35MB) - struktura dat - nevím jak přesně odpovědět, ale když to vezmu z příkladu těch pojišťováků, tak jsou to jednotlivé obchody (kdo, kdy, co, za kolik...) - analýza by měla být dostupná online v rámci firmy, ne na internetu... - uživatelé budou zaměstnanci firmy - běžní uživatelé |
||
Alphard Profil |
#5 · Zasláno: 19. 5. 2014, 10:51:06
„analyzovat skupinu např. 1000 pojišťováků a jejich obchodní výsledky - kolik prodal za měsíc celkem, rozdělení na jednotlivé produkty za měsíc, porovnání s plánem, trend apod...“
V té nejdůležitější věci zrovna nejste moc konkrétní. Přitom na charakteru analýzy závisí doporučená technologie. Kdyby tam nebyl ten trend, řeknu, že vše bez problémů vytáhntete z databáze pomocí SQL a nepotřebujete to komplikovat R nebo něčím podobným. A teď je otázka, jestli je trend okrajová záležitost, kterou bude jednodušší si sám naprogramovat a dál to nekomplikovat, nebo jestli tam „vyšší analýzy“ bude víc a vyplatí se použít specializovaný nástroj. |
||
ttkk Profil |
#6 · Zasláno: 19. 5. 2014, 10:53:48
Ten trend není úplně důležitý...
|
||
Časová prodleva: 10 let
|
0