Datengrundlage

KI braucht gute Daten als Fundament

von - 07.08.2018
Datenfundament
Foto: ktsdesign / shutterstock.com
Eine Künstliche Intelligenz ist nur so gut wie die zugrunde liegenden Daten. Diese müssen aktuell, genau, vollständig und über mehrere Stufen eines Produktionsprozesses hinweg konsistent sein.
Dieser Beitrag wurde erstellt von Matthias Bauer, Executive Architect Data Analytics bei Axians IT Solutions.
Künstliche Intelligenz (KI) ist als neue Technologie bei Analysten und in der deutschen Wirtschaft ein quasi omnipräsentes Thema. Es gibt kaum ein Unternehmen, das sich nicht mit den Chancen von KI beschäftigt. Sowohl bei der Einrichtung moderner Arbeitsplätze als auch in der Produktion setzen viele bereits KI ein oder prüfen eine Integration.
Ein klassischer Einsatz von KI in produzierenden Unternehmen ist das sogenannte Condition Monitoring. Dabei werden mit angebrachten Sensoren die Daten der Anlagen in Echtzeit analysiert und mit Hilfe von KI überwacht, um den Zustand der Maschinen zu prüfen oder mögliche Probleme auf lange Sicht vorherzusehen. Die KI ist beispielsweise in der Lage, die optimalen Toleranzwerte einer Ventilsteuerung zu errechnen, um Fehler zu vermeiden.
Doch ein kognitives System läuft nicht per Plug and Play – einmal anschließen und sofort funktioniert alles reibungslos. Im Gegenteil: Solche Anwendungen erfordern viel menschliche Vorarbeit. Eine KI ist nämlich zunächst einmal dumm. Sie lernt durch die Einspeisung von geeigneten Daten und richtiger Algorithmen. Hier kommen Data Engineers zum Einsatz. Erst danach liefert sie brauchbare Ergebnisse. Data Engineers kümmern sich unter anderem darum, Daten für die Künstliche Intelligenz vorzubereiten, das heißt Daten aus­zulesen, zu transportieren, zu bereinigen, zu halten, zu verknüpfen und wiederholbare Analysen zu ermöglichen. Datenspezialisten bereiten diese so vor, dass Data Scientists auf deren Grundlage geeignete Datenquellen auswählen, kreativ mit den Daten experimentieren und die passenden Algorithmen entwickeln können, um individuelle Fragestellungen zu beantworten.

Die Qualität muss stimmen

Um die Datenqualität sollten sich die Verantwortlichen kümmern, bevor eine KI eingeführt wird, damit diese keine falschen Entscheidungen trifft. Im Gegensatz zu anderen Business-Intelligence-Analysen sind bei kognitiven Systemen und Big-Data-Anwendungen fehlerhafte Daten im Nach­hinein nur noch schwer auffindbar und zu filtern.
Doch woran erkennt ein Data Engineer die richtigen Daten? Der erste Anhaltspunkt ist beispielsweise die Datenquelle. Diese muss vertrauenswürdig sein. Also: Wer hat die Daten zu welchem Zweck an welchem Ort und zu welchem Zeitpunkt erhoben? Außerdem müssen geeignete Daten aktuell, genau, vollständig und über mehrere Stufen eines Produktionsprozesses hinweg konsistent sein. Ein zentraler Punkt ist auch die ausreichende Menge an Daten, um die gewünschte Fragestellung zu beantworten.
Ein Hersteller von Kunststoffgranulat etwa möchte die Ergebnisqualität vorhersagen. Dazu muss er sich zunächst überlegen, welche Daten die KI überhaupt benötigt, um verläss­liche Prognosen entwickeln zu können. Hier sind neben Maschinendaten wie die Vibrationen des Getriebes in der Extrusionsanlage oder die Drehgeschwindigkeit der Schnecke eine Vielzahl weiterer Faktoren wichtig, zum Beispiel die Temperatur und der Druck in der Werkshalle oder die Durchflussmenge der Rohstoffe.
Verwandte Themen