W dniu 23 marca 2009 r. w Warszawie odbyła się kolejna edycja Klubu Controllera. Tematem przewodnim marcowego spotkania była optymalna architektura środowiska analiz. Celem Klubu było zaprezentowanie tematu na rzeczywistym przykładzie i szeroka dyskusja na temat możliwości zastosowania praktycznego owej optymalnej architektury.
Spotkanie rozpoczęło się prowokacyjnym pytaniem: „Czego tak właściwie potrzeba ludziom zajmującym się analizą danych?”. Otrzymano następujące odpowiedzi: szeroka tabela, dużo danych w uporządkowanym formacie, dane aktualne, możliwość obróbki dużych ilości danych, mała awaryjność systemu, podstawowe zabezpieczenia. Eksperci prowadzący Klub - Wojciech Gardziński i Krzysztof Rumiński - posiadający praktyczne doświadczenie w zakresie systemów analitycznych, przygotowani na takie „życzenia”, pokazali, jak praktycznie, ogólnie dostępnymi i darmowymi narzędziami otrzymać spełnienie wszystkich ww. postulatów.
Najważniejszym elementem prezentacji było sporządzenie w pełni wartościowej funkcjonalnie minihurtowni danych, zasilanej z kilku różnych, ale spójnych logicznie, systemów bazodanowych (przykładowe pliki są dostępne na stronie www.isc.explanator.pl).
Sporządzona ad hoc hurtownia danych w pliku MS Access:
- pobiera dane z różnych formatów danych (Access, Excel, DBF, strony Web),
- gromadzi dane w bazie, niezależnej od systemów transakcyjnych, zapewniając im tym samym brak zagrożeń związanych z bezpośrednim dostępem do danych systemu transakcyjnego lub jego plików eksportowych,
- dane są gromadzone w różnych typach baz analitycznych (wszystkie elementy hurtowni danych zostały sporządzone w trakcie spotkania):
- szerokich tabelach (złączonych z wielu tabel systemu OLTP/transakcyjnego), łatwych do pobierania bezpośrednio z Excela,
- bazach relacyjnych, tj. wydzielonych bazach, stanowiących kopię danych systemu OLTP z przeznaczeniem do swobodnego zadawania kwerend z Excela,
- bazie danych OLAP - kostce - pliku.cub, dostępnej dla kwerend OLAP (tabela przestawna Excela bezpośrednio na danych z kostki OLAP).
W trakcie spotkania członków Klubu przygotowano także szereg analiz w Excelu, bazujących na sporządzonej „hurtowni”. Raporty te:
- są w Excelu i pobierają dane kwerendami bez użycia łącz międzyskoroszytowych,
- same odświeżają hurtownię danych bez użycia makr,
- są publikowane również jako strony sieci WEB w sieci lokalnej.
Kluczowymi elementami prezentacji były:
- odświeżenie wykresu przestawnego na stronie sieci Web (Internet Explorer) bezpośrednio z danych źródłowych (tu: plik DBF), bez otwierania Excela oraz Accessa (jednym kliknięciem),
- odświeżenie hurtowni na bazie rzeczywistej 10-oddziałowej firmy, dysponującej danymi, pogrupowanymi miesięcznie w plikach DBF po 19 000 rekordów każdy; odświeżenie takiej bazy (razem ponad 400 000 efektywnych rekordów, odpowiednio poatrybutowanych dla celów dalszych analiz) zajęło niecałe 3 minuty!
Następnie otrzymane rezultaty omówiono w szerszym kontekście architektury pracy analityka - controllera finansowego. Wywołało to ożywioną dyskusję i szereg ocen krytycznych na temat standardów analitycznych, stosowanych w firmach, gdzie nadal królują podstawowe metody wymiany danych (łącza międzyskoroszytowe) i ogromne arkusze z tysiącami funkcji Excela, a elementarne procedury bazodanowe są nadal nieznane.
Wniosek ogólny ze spotkania: „Optymalna architektura analiz jest w zasięgu ręki, a podstawową barierą jej wdrożenia jest wiedza analityków. Koszty są niewielkie, co ma niebagatelne znaczenie w okresie kryzysu gospodarczego”.