DWless BI


Anno amikor kezdtem a szakmát, még textfájlokból építettük a BI rendszereket. Nem használtunk köztes adatbázisokat, mindent nyersen, rém primitív szövegfájl feldolgozó „ETL” eszközökkel oldottunk meg. Az egész relációs világgal csak később kezdtem el foglalkozni, amikor a többdimenziós adatbázis mellé ingyen adta a Microsoft az SQL Servert 😊

Aztán történt egy paradigmaváltás és mindent a relációs adatbázisokban oldottunk meg. A többdimenziós adatbázisok alá relációs adatpiacokat építettünk és a többdimenziós adatbázisokat csak az adatpiaci lekérdezések gyorsítására és egyszerűbbé tételére használtuk. Kétségtelen, hogy ez a kombináció adta/adja a legjobb, legegyszerűbben üzemeltethető megoldást, de az is kétségtelen, hogy az így épített BI rendszer drága és a bevezetése lassú.

Mindezek miatt elindult egy visszarendeződés: Egyre többen kezdtek az önkiszolgáló BI eszközeikkel a relációs réteg teljes kihagyásával újra szövegfájlokból dolgozni. Ezt a folyamatot tovább erősíti a Big Data technológiák és a felhőszolgáltatások terjedése. E három kombinációjával már hatalmas adatmennyiséget tudunk kezelni relatíve egyszerű eszközökkel, adattárház vagy relációs adatbáziskezelők nélkül. 

Ma még az elején járunk ennek az útnak, de a Big Data korszakában készülni kell rá, hogy egyre több helyen meg fog jelenni a DWless BI és egyre több vállalatnál kell majd újra szövegfájlokból dolgozniuk az üzleti felhasználóknak. 

Ezért örömmel jelentem be, hogy építettem egy egyszerű Data Lake-et, amivel el lehet kezdeni taunlni a Power BI workshopokon. Egyelőre kis adatmennyiséggel, üzleti felhasználói szinten, de már használhatjuk. 😊

Elválasztó

Már készül a következő cikk. Kérjen értesítést a megjelenéséről itt.

|