Autor Zpráva
ttkk
Profil
Ahoj všem,

potřeboval bych poradit ohledně následujícího:

V tuto chvíli mám data v excelovském souboru (vcelku větší množství dat - soubor má cca 35 MB). Tato data bych potřeboval analyzovat - vytvářet různé grafy a tabulky.

V tuto chvíli celou analýzu provádím přímo v excelu za pomocí VBA a Kontingenčních tabulek. Nicméně je to takové krkolomné, a s přibývajícími měsíci poroste i velikost souboru - očekávám, že ke konci roku už by to mohlo být mezi 80 - 100 MB.

Z tohoto důvodu se mi stávající řešení nelíbí. Pro uživatele časem přestane být pohodlné - zejména pomalé.

Potřeboval bych vymyslet nějaké lepší řešení. Asi nejvíce by se mi líbilo vytvořit tuto analýzu online - prostřednictvím webových stránek s využitím databáze. Jako variantu B mám vytvoření desktopové aplikace, která by tato data analyzovala.

Mé zkušenosti jsou zatím malé - zvládám jakž takž VBA, HTML - začátky, PHP - nic moc, JavaScript - začátky, SQL - vůbec.

Nicméně rád se naučím jakýkoli programovací jazyk - čas mě zatím netlačí, navíc mě programování baví.

V podstatě potřebuji poradit nejlepší / nejelegantnější řešení (v čem to celé udělat a co je třeba se kvůli tomu naučit).

Hotovému řešení bych se raději vyhnul (tipům se ale nebráním), rád bych si to celé udělal sám.

Omlouvám se za delší příspěvek...
juriad
Profil
Mám několik otázek:
Chceš vytvořit vizualizaci, na které můžeš sledovat vývoj dat?
Chceš provádět jednoduchý náhled na data, nebo pokročilejší statistiku (například: korelace, nezávislost)?
Budou ti stačit jen jednoduché funkce jako min, max, průměr, počet?
Chceš mít možnost jednoduše provést ad-hoc dotaz?
Jde ti o grafický výstup, či ti stačí jednoduchý výpis a pár grafů?

Svěříš se jaké povahy jsou ta data? Co s nimi chceš dělat?

Osobně bych to neřešil webovými nástroji, ale něčím k tomu určeným: R; z placených by to byla Matematika a Matlab.

Ve všech těchto nástrojích se vlastně programuje, ale je to programování na pomezí matematiky (nejsou příliš třeba cykly, funkce).

Délka příspěvku je fajn, alespoň to z tebe nemusíme dlouze tahat.
Alphard
Profil
Částečně naváži na juriada. Kdysi jsem si hrál s nasazením Octave (open source projekt velmi podobný vynikajícímu Matlabu) na VPS a přístupu k němu přes PHP. Je tam trochu problém směrovat data z databáze do Octave (dočasně a doteď :-) jsem to vyřešil přes soubory), ale zbytek funguje perfektně. Octave ušetří práci s výpočty (hodí se přesně na to, co jsem potřeboval) a výsledky jsem pak bez problémů exportoval a zobrazoval pomocí interaktivních javascriptových grafů.
ttkk
Profil
Ahoj, díky za reakce.

K upřesnění:

- jedná se mi o jednoduchý náhled na data - pár grafů - koláčové, sloupcové, spojnicové (pár grafů znamená odhadem tak 20)

- pár tabulek s vybranými daty (které budou fungovat velmi podobně jako Kontingenční v Excelu - co se týče nasčítávání hodnot).

- jedná se o obchodní data (konkrétnější být nemohu, ale v podstatě úplně stejný princip, jako kdyby jste chtěli analyzovat skupinu např. 1000 pojišťováků a jejich obchodní výsledky - kolik prodal za měsíc celkem, rozdělení na jednotlivé produkty za měsíc, porovnání s plánem, trend apod...)

- data jsou v tuto chvíli v excelu (xls), ale zřejmě by nebyl problém je uložit v příhodnějším formátu...

- množství dat bude neustále narůstat - za rok počítám, že to dělá dohromady cca 100 - 150 MB (v tuto chvíli 35MB)

- struktura dat - nevím jak přesně odpovědět, ale když to vezmu z příkladu těch pojišťováků, tak jsou to jednotlivé obchody (kdo, kdy, co, za kolik...)

- analýza by měla být dostupná online v rámci firmy, ne na internetu...

- uživatelé budou zaměstnanci firmy - běžní uživatelé
Alphard
Profil
analyzovat skupinu např. 1000 pojišťováků a jejich obchodní výsledky - kolik prodal za měsíc celkem, rozdělení na jednotlivé produkty za měsíc, porovnání s plánem, trend apod...
V té nejdůležitější věci zrovna nejste moc konkrétní. Přitom na charakteru analýzy závisí doporučená technologie. Kdyby tam nebyl ten trend, řeknu, že vše bez problémů vytáhntete z databáze pomocí SQL a nepotřebujete to komplikovat R nebo něčím podobným. A teď je otázka, jestli je trend okrajová záležitost, kterou bude jednodušší si sám naprogramovat a dál to nekomplikovat, nebo jestli tam „vyšší analýzy“ bude víc a vyplatí se použít specializovaný nástroj.
ttkk
Profil
Ten trend není úplně důležitý...

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: