Data Science ohne Data Scientists? Guided vs. Self-Service vs. Augmented Analytics

Gute Data Scientists sind rar und kosten viel. Das kann gerade für den Mittelstand eine große Hürde darstellen auf dem Weg zum datengetriebenen Unternehmen. Neue Analytics Systeme sollen Abhilfe schaffen.
Share on facebook
Share on twitter
Share on linkedin
Share on xing
Share on whatsapp
Share on email

Im Trend sind aktuell vor allem drei Analytics Richtungen, welche den Bedarf an Data Scientists reduzieren sollen:

 

1. Guided Analytics 

Ziel von Guided Analytics ist die Entwicklung von interaktiven visuellen Schnittstellen, mit denen Geschäftsanwender größtenteils selbständig datengetriebene Entscheidungen treffen können.

In diesen Anwendungen soll der gesamte Analyseprozess von Daten- bis Ergebnisaufbereitung mehrere Interaktionspunkte aufweisen, damit die Geschäftsanwender selbst verschiedene Fragestellungen flexibel bearbeiten können. 

Die Interaktionspunkte werden durch Data Scientists entworfen und der eigentliche Analyseprozess kann von da an semi-automatisiert durch die Domänenexperten erfolgen, ohne dass Datenexperten ständig Anpassungen vornehmen müssen. Auf diese Weise wird der Benutzer durch den Datenwertschöpfungsprozess geführt (deshalb das Wort “guided” im Namen).

 

2. Self-Service Analytics

Unabhängig von Data Scientists und der IT sollen Geschäftsanwender mit Hilfe von Self-Service Analytics Erkenntnisse aus Daten extrahieren können.

Um diese anwendergesteuerten Datenanalysen verwirklichen zu können, muss es den Geschäftsanwendern möglich sein, eigenständig und voll automatisiert auf Unternehmensinformationen zuzugreifen, Abfragen durchzuführen und Berichte zu erstellen. 

Die IT schafft dabei nur noch die Voraussetzungen für den Zugriff auf die Daten und das Erstellen der entsprechenden Schnittstellen mit grundlegenden Analysefunktionen und einem zugrunde liegenden Datenmodell, welches typischerweise für den Geschäftsanwender passend vereinfacht bzw. reduziert wurde.

 

3. Augmented Analytics

Noch einen Schritt weiter geht Augmented Analytics. Das Meinungsforschungsinstitut Gartner erwähnte die Technologie („Augmented Data Discovery“) erstmals in ihrem 2017er „Hype Cycle“ Trendbarometer und bezeichnete kürzlich Augmented Analytics erneut als Trend Nummer 1 im Bereich Daten und Analytics.

Im Kern wird bei Augmented Analytics die Datenwertschöpfung mit Hilfe von maschinellem Lernen und natürlicher Sprachgenerierung vollständig automatisiert. D.h. die Datensätze eines Unternehmens können automatisch durchsucht, bereinigt und analysiert werden, und die Erkenntnisse werden dann sogar in Hypothesen und Handlungsempfehlungen für die Geschäftsanwender umgewandelt. 

Konkret kann man sich Augmented Analytics als ein intuitives Erforschen von Daten in der Art einer gesprochenen Unterhaltung vorstellen, bei welchem handlungsorientierte Erkenntnisse für den Geschäftsanwender instantan in klar verständlicher Sprache und in anschaulichen Diagrammen auf verschiedenen Geräten ausgespielt werden (man denke z.B. an Smart Speaker, Smartphones, Smartwatches, digitale Whiteboards bzw. Flipcharts oder eben auch Augmented Reality Brillen).

 

Zusammenfassender Vergleich

Die Datenwertschöpfungsketten, die sich durch die drei vorgenannten Analytics Richtungen ergeben, lassen sich wie folgt vergleichen:

guided_analytics_workflow
Ein Vergleich der Rollenverteilung in den drei (teil)automatisierten Datenwertschöpfungsketten.

Guided Analytics wird dabei durch einen semi-automatisierten Ansatz charakterisiert, bei dem Data Scientists und Geschäftsanwender kollaborativ mit einem Automatisierungstool Daten aufbereiten, Analysen erstellen oder Modelle entwickeln sowie Ergebnisse visualisieren. Data Scientists unterstützen bei der Interpretation der Analyseergebnisse und damit bei der Überführung der gewonnenen Erkenntnisse in Geschäftsentscheidungen. Automatisierung spielt in diesem letzten Schritt keine weitere Rolle mehr.

Im großen Unterschied dazu kommt der Self-Service Analytics Bereich nahezu ohne Data Scientists aus, und die Datenaufbereitung sowie die Analysen und Modellentwicklung laufen voll automatisiert ab. Auch die Ergebnisaufbereitung über z.B. Berichte oder Dashboards erfolgt zu einem großen Teil automatisiert, erfordert jedoch noch Input und weitere Auswahl durch den Geschäftsanwender, welcher schließlich darauf aufbauend weitestgehend selbständig die Ergebnisse interpretiert. 

Noch weiter vorangetrieben wird die Automatisierung im Bereich Augmented Analytics. Hier ist auch die Ergebnisaufbereitung bzw. Modellbereitstellung voll automatisiert und selbst bei der Ergebnisinterpretation helfen automatisierte Erklärungen bei der Überführung der Analyseergebnisse in Geschäftsentscheidungen.

 

Fazit

Die hier vorgestellten Analytics Ansätze stellen gegenüber herkömmlichen Datenwertschöpfungsketten mehrere Vorteile dar. Ihnen gemein ist die zunehmende Unabhängigkeit von Data Scientists und IT Abteilungen durch Automatisierungstools. Das spart Kosten und Zeit, denn die händisch ausgeführten Arbeitsschritte von Datenaufbereitung, Datenbankabfrage bis zur Erstellung von Berichten etc. sind aufwändig und benötigen die Präsenz von Datenexperten. Außerdem sind manuelle Prozesse fehlerhafter, was wiederum umfangreichere Tests erfordert. 

Generell gilt bei Analyseergebnissen, dass durch domänenspezifische, kontextualisierte Aufbereitung und Anreicherung mit leicht verständlichen Erzählungen ein großer Gewinn für den Geschäftsanwender entsteht. Wenn dies noch dazu (teil)automatisiert gelingt und somit potenzielle Reibungsverluste durch andauernde Kommunikation mit Tech-Abteilungen vermieden werden, so wird die Zeit bis zur handlungsorientierten Erkenntnis erheblich beschleunigt.

Dass durch obige Analytics Ansätze mehr Mitarbeiter befähigt werden datengetriebene Entscheidungen zu treffen, bringt gewiss ebenso große Potenziale mit sich.

Es sind aber auch Nachteile bzw. Gefahren mit diesen neuen Analytics Richtungen im Auge zu behalten. So fehlt im obigen Diagramm als Punkt Null noch vor der Datenaufbereitung die eigentliche Fragestellung. Die im Business Kontext richtigen Fragen zu stellen und zu verstehen, welche von diesen technisch und fachlich angegangen werden können, ist eine nicht-triviale Herausforderung. Dafür wird häufig der Austausch zwischen Domänen- und Datenexperten benötigt. Diese Tatsache geht gerade mit den Self-Service und Augmented Analytics Ansätzen unter. Die Gefahr dabei ist eine grundsätzliche Fehlausrichtung der Datenwertschöpfungskette, welche am Ende mehr Schaden als Nutzen bringen kann.

Nicht zu unterschätzen sind außerdem die erforderlichen analytischen Fähigkeiten, um Analyseergebnisse bestmöglich aufbereiten zu können. Insbesondere mit Self-Service Analytics kann die Eigenständigkeit des Anwenders an dieser Stelle zu einem Nachteil werden. So könnten z.B. Visualisierungsarten fälschlicherweise nach ästhetischen Gesichtspunkten ausgewählt werden und nicht nach Aussagekraft. Mit Augmented Analytics ist dieses Problem weg abstrahiert und fällt damit weniger ins Gewicht.

Gerade für KMUs und öffentliche Einrichtungen, die bereits reichlich Daten sammeln und nun möglichst schnell und ressourcenschonend datengetrieben agieren wollen, können die hier vorgestellten Analytics Ansätze vielversprechende Möglichkeiten aufzeigen. Es ist nur mit Blick auf die genannten Nachteile besonders anzuraten, nicht vollständig auf Data Scientists verzichten zu wollen (im Falle von Guided Analytics sind diese sogar unbedingt erforderlich, siehe Diagramm oben).

 

Status Quo und Ausblick

Guided Analytics kann bereits als Mainstream Anwendung angesehen werden, während sich der Self-Service Analytics Ansatz erst seit Kurzem weiter verbreitet. Für Augmented Analytics gibt es zwar bereits eine Reihe von Anbietern, doch kann die Technologie aktuell noch nicht oben beschriebene Vision der vollständigen Automatisierung zufriedenstellend umsetzen. Es ist angesichts der momentan immensen Fortschritte im Bereich AutoML (Abkürzung für automated machine learning) sowie auf dem Gebiet der intelligenten Sprachverarbeitung und -generierung aber davon auszugehen, dass ausgereifte Augmented Analytics Technologien bereits in wenigen Jahren erhältlich sind.

5 1 vote
Article Rating
Abonnieren
Benachrichtige mich bei
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x