Hulladékadat hasznosítás


Egy ügyfél adataira működés szempontjából csak addig van szüksége a vállalatnak amig az ügyfél ügyfél, vagy a míg a törvényi szabályozás előírja. Egy szenzor adataira jellemzően csak órákig, vagy pár napig van szükségünk a működés monitorozásához, a logokat sem akarjuk túl sokáig tárolni, mert felesleges.

Minden adatnak van egy életciklusa, aminek lejárta után hulladékadat lesz belőle. A forrásrendszerekből töröljük őket, mert a működéshez nincs szükség rájuk, a rendszert felesleges terhelik.

A kérdés csak az, hogy mit kezdjünk ezekkel a hulladékadatokkal. A felhőszolgálatások és a Big Data együttesen megteremtették az adatok olcsó tárolásának lehetőségét, kézenfekvőnek tűnik hogy tároljuk őket, hiszen nem kér kenyeret. Csakhogy a tárolás olcsósága önmagában nem elég erős érv, hiszen - bár a tárolás tényleg olcsó de - a felhasználás, vagy a karbantartás már egyáltalán nem az.

Ha ugyanis egy adatot készletezünk akkor arról kereshető nyilvántartást kell vezetnünk, az adatot címkézni és rendszerezni kell, és ki kell jelölnünk egy felelőst aki az adatokat karbantartja. És bár ezek nem tűnnek nagy feladatnak, a vállalatok nem nagyon tudják/akarják ezt a szintet megugorni... De erről írtam már az adatvagyon felelős című cikkben, úgyhogy kanyarodjunk vissza az eredeti problémához: Mit kezdjünk a hulladék adatokkal?

Egy adatról már jó előre el tudjuk dönteni, hogy lehet-e potenciál a hasznosításában. Az értékét nem tudjuk jól megbecsülni, de azt igen, hogy lehet-e benne érték vagy sem, illetve azt is jól meg tudjuk becsülni, hogy mikorra válik teljesen értéktelenné. E két információ birtokában pedig meg lehet tenni az első lépéseket a vállalati (hulladék)adathasznosítási stratégia kialakítása felé.

Számtalan példát tudnék mesélni arról, amikor tudtuk hogy van potenciál a hulladékadatokban, tudtuk, hogy egyszer fontosak lehetnek, de nem tároltuk el őket. Nem tároltuk le őket, mert nem a normál üzletmenetben lettek volna fontosak, hanem akkor amikor baj van. Vagy akkor amikor valami új dolgot szeretnénk kifejleszteni.  Vagy akkor amikor azt akarjuk elemezni, hogy valami miért nem történt meg. A megtörtént események elemzésére ott az adattárház. De a meg nem történt események adatait a hulladékadatok között kell keresnünk.

De mondok más példát is: Merőben új vállalati stratégiákat láttunk kialakulni a „hulladékadatokra” alapozva és forgattunk át egy bevétel maximalizáló vállalatot, egy felhasználást/fogyasztást maximalizáló vállalattá, amely hosszabb távon sokkal sikeresebb, mint a negyedévről negyedévre való bevételmaximalizáló stratégia.

És ezek még csak a vállalaton belüli hulladékadat hasznosításra példák, de a hulladékadatnak vállalaton kívül is lehet értéke. Gondoljon bele, hogy egy autóban működő ABS adatai értékesek lehetnek a féket gyártó vállalatnak, egy telemetriai biztosítást nyújtó biztosító társaságnak, vagy a sofőrök vezetési stílusát javítani akaró kamiontársaságnak.

Lehet, hogy önmagában a hulladékadatban nincs potenciál és értéktelen, de érdemes elgondolkozni azon is, hogy a hulladékadatot feldúsítva a hulladékadat keletkezési körülményének jellemzőivel értékes adatot kapunk-e. Egy mérési adat kiegészítve a méréskor mért hőmérséklettel, már lehet hogy értékessé teszi az önmagában értéktelen mérési adatot.

Az is előfordulhat, hogy a hulladékadatot önmagában még nem tudjuk hasznosítani, de a hulladékadatok idősorát már igen. Tendenciákat figyelhetünk meg, szokásostól, eltérő viselkedésekre deríthetünk fényt. Érdemes ezeket mind-mind figyelembe venni akkor, amikor a hulladékadatok hasznosításán gondolkozunk.

Összefoglalva: A hulladékadat ész nélkül tárolásának önmagában semmi értelme. Még akkor se, ha nem kerül pénzbe. De a hulladékadatnak van olyan része, ami hasznosítható, és el kell kezdeni gondolkodni azon hogy melyik része az. És el kell gondolkodni azon is, hogy mit dobunk ma ki, mit nem gyűjtünk, vagy a gyűjtött adatokkal mit kezdünk most, mit kezdhetnénk a jövőben. Mert amikor szüksége lesz rá, akkor azonnal fog kelleni, és nem elég akkor elkezdni gyűjteni, mert hiányozni fog az idősor...

Elválasztó

Már készül a következő cikk. Kérjen értesítést a megjelenéséről itt.

|

Kővári Attila
2018. november 06.
Címkék:

1 Hozzászólás

Incremental refresh

Attila, erről jut eszembe, hogy hallottál valamit esetleg arról, hogy Power BI-ban elérhető lesz-e az incremental refresh PRO verzióban is (nem csak Premiumban)? Jelenleg elvileg csak Premiumban érhető el...
Ez nagyon hasznos lenne, mert pl. be lehet állítani hogy mindig az utolsó x évet tárolja csak az adatmodell, meg persze nem kellene mindig a teljes adatsort frissíteni, hanem lehet paraméterezni, hogy mennyi adatok akarunk egy-egy frissítésnél behozni.
Egyébként érdekes a cikk, köszi! :) Bár én úgy vagyok ezzel, hogy szerintem kétféle ember létezik, az egyik aki mindent gyűjtögetni akar és semmit nem dob ki, a másik típus, aki viszont minden feleslegestől igyekszik minél előbb megszabadulni... Pl. én soha semmilyen email-t nem törlök, a feleségem viszont gyakorlatilag olvasás után minden email-t töröl. :)

Szóljon hozzá!

Szabály: Legyen kedves, segítõkész és vállalja a nevét.
A mező tartalma nem nyilvános.
  • A web és email címek automatikusan linkekké alakulnak.
  • Engedélyezett HTML elemek: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • A sorokat és bekezdéseket automatikusan felismeri a rendszer.
ANTI SPAM
A robot regisztrációk elkerülésére.
Image CAPTCHA
Figyeljen a kis és nagybetűk használatára