Big Data Analysis

Big Data Analysis

Eine unüberschaubare Menge an digitalen Komponenten produziert kontinuierlich eine noch größere Menge an Daten, welche zu einem signifikannten Anteil keine weitere Verwendung finden und bis zu ihrem digitalen Ende in Datenarchiven schlummern. Mittlerweile wurde aber das Potenzial von unstrukturierten Daten für die Gewinnung von neuen Informationen erkannt. Mit ausgefeilten Analysemethoden wird in gigantischen Datenmengen nach der  buchstäblichen Nadel im Heuhaufen gesucht.

eiweck consulting beschäftigt sich auch mit diesem Thema und entwickelt gemeinsam mit den Kunden unter Anwendung bestehender Methoden spezielle Applikationen, welche eine gezielte Auswertung von Daten aus beliebigen Datenquellen ermöglichen. Neben dem laufenden Reporting wird dabei  besonderes Augenmerk auf die Verwertung der Ergebnisse für den laufenden Betrieb gelegt. Der Einsatz von Machine Learning Algorithmen ermöglicht z.B. das Modellieren spezifischer Netzwerkesegmente und in weiterer Folge prädiktive Aussagen über den Zustand des Systems. In bestimmten Fällen können Veränderungen im System, welche zu Ausfällen führen könnten detektiert, und als präventiver Alarm an den Betreiber weitergeleitet werden. Mit den verfügbaren Daten kann dieser eine genauere Analyse durchführen und entsprechende Maßnahmen einleiten bevor die Auswirkungen des Problems das Service für den Endkunden beeinflussen.

Das folgende Bild illustriert die Vorlauftemperaturen in einem Smart Meter Netzwerk über den Zeitverlauf von ca. 8 Monaten. Die Datenmenge beträgt ca. 100MB.

Rohdaten Smart Meter Netzwerk

Für den Laien ein buntes Bild erkennt ein Experte in der grafischen Darstellung bereits Regelmäßigkeiten, Ausreisser oder ander Artefakte.

Mit geeigneten Methoden können aus diesen statistischen Daten Modelle für die unterschiedlichen Zustände (ok, Fehler, Trend, …) im Systems extrapoliert werden. Eine endgültige Klassifikation erfolgt dabei immer mit den jeweiligen Systemexperten.  Diese Modelle werden dann im laufenden Betrieb mit den aktuellen Daten verglichen und auf Basis eines vordefinierten Regelwerkes automatisiert ausgewertet. Eine kontinuierliche Verbesserung des Modells erfolgt ebenfalls laufend mittels Anwendung von Machine Learning Algorithmen.

In weiterer Folge können aus diesen Daten ebenfalls automatisiert beliebige Reports für Qualitätskontrolle oder SLA-Nachweis  generiert werden.