Data Ops statt Data Labs lautete das Thema der diesjährigen Predictive Analytics World am 18. und 19. November 2019 in Berlin. Raus aus der Testphase, rein in den Markt. Wie erfolgreich werden Projekte aus den Bereichen Machine Learning, Artificial Intelligence, Data Science und Analytics mittlerweile im realen Geschäftsleben eingesetzt? Achtung Spoiler: Sehr – aber nicht mit den ursprünglich angedachten Prozessen und Strukturen.

Schon die Keynote von Dean Abbott, Co-Founder und Chief Data Scientist von SmarterHQ, sowie President von Abbott Analytics, Inc. über die Vorhersage des Customer Lifetime Values machte deutlich, dass der Business Case für die Wahl der passenden Machine Learning Modelle entscheidend ist.

Das Team von Scout24 erläuterte, wie und warum es sein zentralisiertes AI-Team aufgelöst und in die Business Units verteilt hat, während gleichzeitig eine AI-Plattform geschaffen wurde. Die Produkt-Teams sollen damit befähigt werden, selbstständig AI zu nutzen, ohne dass ein zentrales technisches und wissenschaftliches Fundament fehlen darf. Und was macht ein Verlag wie Ringier Axel Springer? Er baut auch eine Plattform. Während Scout24 jedoch diesen Ansatz wählt, um seine Produkt-Teams zu stärken, schneller bessere Produkte auszuliefern, nutzt RAS diesen Ansatz, um seinen Millionen von Kunden die optimalen Informationen in Echtzeit bereitzustellen. Was haben beide Ansätze gemeinsam: Geschwindigkeit, Flexibilität und Nähe zum Kunden bzw. Nutzer.

Shopify und Schneider Electric haben gezeigt, dass ihre Machine Learning Projekte von Uplifting Modelling bis Recommender Systems den Laboren entkommen sind und im globalen Business-Betrieb bei Angestellten und Kunden eingesetzt werden. Gegenüber den letzten Jahren hat das Wort deployment den Begriff development abgelöst.

Also wie kriegt man jetzt den Data Scientist ins Produkt?

Wie erstellt Continental seine Planung? Mit Explainable AI. Das Unternehmen hat ein System entwickelt, bei dem ein zentraler Fokus darauf liegt, den Planern und Strategen vertrauenswürdige und erklärbare Vorhersagen zu liefern. Hier helfen UX und die passenden Dashboards.

Wer benötigt noch Kunden-Tests? Coca-Cola jedenfalls nicht. Sie nutzen ein Machine Learning Modell, mit dem sich vorhersagen lässt, wie erfolgreich Werbespots, die für ein spezifisches Land entwickelt wurden, in einem anderen Land sind: 9 Monate, 5 – 10 Data Scientists, Genauigkeit 97%.

Ein weiteres interessantes Modell boten Roche Diagnostics, die innerhalb von drei Jahren ein Team von 50 Datenexperten aufgebaut haben. Auf der einen Seite handelt es sich hierbei um eine zentrale Abteilung, die als Auftragsdienstleister für andere Bereiche arbeitet, auf der anderen Seite schaffen sie es, Produkte wie Sensor Image Processing innerhalb kurzer Zeit zur Produktreife zu bringen. Interessant ist der Ausblick. Das zukünftige Ziel ist es, die Data Scientists und Data Analysts in die Produktteams zu entsenden und den zentralen Data Bereich nur noch zur Koordination zu nutzen. Da ist die russische Airline S7 schon weiter. Hier arbeiten die 40 Data Scientists grundsätzlich in cross-funktionalen Teams.

Was sind die Herausforderungen, wenn man aus Daten Produkte entwickelt? Growth from Knowledge zeigt eindrucksvoll, dass das Vertrauen in Daten und Modelle vorhanden sein muss und Skalierung im Vorfeld ein Bestandteil der Strategie sein sollte. Sonst legen Support und Komplexität das ganze Projekt lahm. Und wie schafft man Vertrauen in die KPIs und reduziert den Supportaufwand? Indem man Quality Performance Indicators (QPI) bereithält, aus denen die KPIs berechnet werden.

Besonders interessant für uns: McMakler nutzt seit Kurzem ein auf Objekt- und Geodaten basierendes Machine Learning Verfahren, um für alle potenziellen Kunden eine automatisierte Immobilienbewertung zu erstellen. Die durchschnittliche Abweichung zum tatsächlichen Wert liegt bei 11,8%.

Fazit: Fluide Prozesse um Embedded Data Scientists

Was ist das Fazit der Veranstaltung: Die Euphorie, Daten zu nutzen, ist nicht verflogen. Aber inzwischen wird der Fokus auf die Entwicklung kurzfristiger Erfolge in Form von Produkten und Services gelegt, die das bestehende Geschäftsmodell unterstützen oder ein Eigenes darstellen. Um dies zu erreichen, werden die entstandenen Data Science Abteilungen vielfach wieder aufgelöst und auf die produktiven Bereiche aufgeteilt. Der Embedded Data Scientist wird zu einem neuen Begriff. Gleichzeitig übernehmen technische und systemische Plattformen die notwendige Koordination. Und genau in diesem Aspekt liegen die Herausforderungen der Zukunft, denen auch Europace sich stellen wird.