H2O will jede Firma zum KI-Unternehmen machen
H2O Driverless AI
von Hartmut Wiehr - 20.11.2019
![H2O Forrester H2O Forrester](/img/1/4/1/8/2/7/4/H2O-Forrester_w282_h298.jpg)
(Quelle: Forrester „Automation-Focuses Machine Learaning Solutions“ (2. Quartal 2019))
Mit H2O Driverless AI lassen sich laut Unternehmens-Website „Aufgaben in Minuten erledigen, die früher Monate in Anspruch nahmen“. Mit Driverless AI könne „jedermann, sowohl erfahrene wie auch Junior Data Scientists, Domain Scientists und Data Engineers, Modelle für Machine Learning entwickeln“.
Was dafür alles an Funktionen aufgefahren wird, deutet eine Auflistung auf der Website an: Automatic Feature Engineering, Machine Learning Interpretability (MLI), Natural Language Processing (NLP), Time Series, Model Deployment and Operations, Automatic Visualization, Flexibility of Data and Deployment, Nvidia GPU Acceleration und Bring-Your-Own Recipes.
Der grundlegende Ablauf der Arbeit mit Driverless AI besteht laut H2O aus fünf Schritten: Als Erstes bringen die Anwender ihre Daten aus unterschiedlichsten Quellen in das Modell ein, etwa Daten aus der Cloud, aus Big-Data- oder Desktop-Systemen. Als Nächstes dreht sich alles um das Verständnis der Daten, kümmert man sich um Zusammenhänge, Sonderfälle oder fehlende Angaben.
Drittens werden automatisiert Vorhersagen erstellt. Auf Basis von Best-Practice-Modellen und mit High-Performance-Computing werden Tausende von Modellen wieder und wieder durchkalkuliert. Im vierten Schritt geht es darum, die erstellten Vorhersagen zu prüfen und die komplexen Zusammenhänge auch für Nichtfachleute möglichst verständlich zu erklären. Das geschieht vor allem über automatisiert erstellte Dashboards. Im letzten Schritt schließlich können Anwender „ultra-low latency Python or Java Automatic Scoring Pipelines“ einbringen, „that include feature transformations and models“.
Und weil die großen Versprechungen von H2O mehr sind als bloßes Marketing-Getöse, hat Forrester Research H2O in seinem Report „Automation-Focused Machine Learning Solutions“ vom Mai 2019 neben DataRobot in das Spitzenfeld der „Leader“ eingestuft. Zur Begründung heben die Analysten die besondere Rolle der Automatisierung in Driverless AI hervor. Die Plattform biete dabei eine breite Palette an Konfigurationsmöglichkeiten, sodass die IT-Abteilung die Kontrolle über die Automatisierung behalte.
Allerdings, so Forrester, müssten die Fähigkeiten der eingesetzten Modelle noch verbessert werden, insbesondere bei den Tests. Da viele Unternehmen aber Schwierigkeiten hätten, teure Data Scientists zu verpflichten, biete die H2O-Lösung mit ihrem Automatisierungspotenzial einen Ausweg, weil sie vorhandene IT-Teams produktiver mache.