05.03.2018

Hebel liegt in der Weiterverarbeitung von Daten

Ein entscheidender Punkt ist die Weiterverarbeitung von Daten, um sie effizient und effektiv nutzbar zu machen. Abstrakt kann der Vorgang so beschrieben werden: Unternehmen sammeln Daten und clustern sie, auf dieser Basis können Machine Learning Modelle geschaffen werden. Nach einer Trainings- und Testphase können die Modelle in die Produktion eingebaut und für Vorhersagen genutzt werden.

Data Lakes als passende Infrastruktur

Als Basis für die Weiterverarbeitung auch durch künstliche Intelligenz, eignen sich Strukturen wie Data Lakes. Im Gegensatz zu hierarchischen Data Warehouses, in denen die Daten in Ordnern an unterschiedlichen Orten gespeichert werden, sammelt ein Data Lake alle Daten an einem Ort. Will man im Bild des Datensees bleiben, können die neu hinzukommenden Daten als Quellen und Zuströme gesehen werden.