Daten haben einen begrenzten Wert – die 5 wichtigsten Gründe

Die Veredelung von Daten gehört heutzutage zu den wichtigsten Werttreibern der Wirtschaft. Unternehmen müssen ihre Datenstrategie jedoch kritisch überprüfen, sonst sind spätere Enttäuschungen vorprogrammiert.
Share on facebook
Share on twitter
Share on linkedin
Share on xing
Share on whatsapp
Share on email

„Daten sind das neue Öl“ ist zu einem geflügelten Wort geworden. Wenig spricht man dagegen über die fundamentalen Begrenzungen im Geschäft mit den Daten, welche weit über den Datenschutz hinausgehen. Unternehmen können Enttäuschungen vermeiden, wenn sie sich über diese Limitierungen im Klaren sind und ihre Datenstrategie entsprechend anpassen.

 

1. Datenqualität

Analyseverfahren sind durchaus robust gegen verschiedene kleinere Verzerrungen in den Daten und ein gewisses Maß an fehlerhaften Daten kann die Generalisierbarkeit von statistischen Modellen sogar erhöhen; trotzdem ist eine gründliche Datenaufbereitung entscheidend, und zwar im Hinblick auf Konsistenz, Plausibilität, Vollständigkeit und Bedeutung. Andernfalls läuft ein Unternehmen Gefahr unsinnige Erkenntnisse zu generieren und darauf basierend falsche Business-Entscheidungen zu treffen. Die Phrase „Garbage In, Garbage Out” aus der Informatik trifft auch beim Thema Datenwertschöpfung zu.

Als anschauliches Beispiel kann ein Fitness Armband dienen, mit dem Sie Ihre Aktivität tracken wollen. Wenn Sie dieses vornehmlich in stressigen Situationen auf der Arbeit ablegen, dann werden die getrackten Daten systematisch verzerrt. Evtl. sind gerade die fehlenden Daten entscheidend, um einen guten Überblick zu erhalten. Dieses etwas künstliche Beispiel lässt sich leicht in relevante Bereiche übertragen. Denken Sie an Maschinen- und Sensordaten in der Produktion. Dort dürfen fehlende Daten nicht ignoriert werden, da gerade diese auf Defekte hinweisen können.

Unternehmen sollten berücksichtigen, dass es bei großen Datenmengen schwieriger ist eine hohe Datenqualität zu gewährleisten, so dass hier je nach Anwendungsfall das Prinzip weniger ist mehr zum Tragen kommt.

 

2. Komplexität

Mehrdimensionale und verknüpfte Datensätze sind besonders wertvoll, allerdings wächst mit der Komplexität sowohl der Anspruch an die technische Infrastruktur, als auch die Herausforderung zu verstehen, was mit den Daten genau gemacht werden kann. Ein verbreiteter Anwendungsfall hierfür ist z.B. die Integration von Wetter-, Social-Media- oder Website-Daten in die Absatzprognose. 

Auch die eigentliche Umsetzung von analytischen Methoden ist anspruchsvoller und teurer mit komplexeren (z.B. unstrukturierten) Daten. So ist es beispielsweise bei der Berücksichtigung von vielen Variablen schwieriger die Algorithmen für das maschinelle Lernen zu trainieren. Schnell wird hier der Wald vor lauter Bäumen nicht mehr gesehen, umso mehr, wenn entsprechende Kompetenzen im Unternehmen fehlen. 

 

3. Datenfrische

In den meisten realen Anwendungsfällen veralten Daten mit der Zeit. Denken Sie z.B. an Empfehlungssysteme in Online Marktplätzen. Diese müssen verstehen, dass ältere Daten einen geringeren Wert haben, weil sich die Präferenzen der Besucher mit der Zeit ändern. 

Daten verlieren außerdem schon allein deshalb mit der Zeit an Wert, weil die Konkurrenz wahrscheinlich äquivalente Daten sammelt und damit der potentielle Wettbewerbsvorteil durch die Datenwertschöpfung erlischt. 

Hinzu kommt, dass es bei großen und komplexen Datensätzen schwierig ist ein hohes Maß an Datenfrische zu gewährleisten. Häufig wird so das Datenmanagement zum größten Flaschenhals in der Datenwertschöpfung.

 

4. Redundanz

Je mehr Daten vorhanden sind, desto eher überschneiden sich neue Daten mit den bereits bestehenden Datensätzen. Das reduziert natürlich den Wert der „neuen” Daten. 

Maschinen in der Produktion sollen ja genau das tun: repetitive Arbeiten erledigen. Das führt eben zu einer enormen Redundanz in den Maschinen- und Sensordaten. Die aufschlussreichsten Daten entstehen aber in den Ausnahmesituationen. Deshalb kann es ein sinnvoller Ansatz sein die Maschinen kontrolliert in Stresssituationen zu bringen oder diese anderweitig zu simulieren.

Eine weitere Lösung können passende Filter sein, die nur die Daten erheben, welche neue Signale versprechen. Das treibt jedoch die Datenerfassungskosten stetig in die Höhe und begrenzt somit schlussendlich ebenso den Wert weiterer Daten. 

 

5. Sinkender Grenzertrag

Wenn ein einzelner Faktor bei sonst gleich bleibenden Rahmenbedinungen erhöht wird, so ist oftmals beobachtbar, dass der Output ab einem bestimmten Level zunehmend langsamer wächst. Das bekannteste Beispiel für dieses ökonomische Modell kommt aus der Landwirtschaft: Mit Düngemitteln lässt sich der Ertrag pro Bodenfläche erheblich steigern, jedoch saturiert dieser Effekt ab einer bestimmten Düngemittelmenge (im Extremfall kann der Boden vergiftet und somit der Ertrag verringert oder sogar vernichtet werden).

Bei der Datenwertschöpfung lassen sich ebenso Beispiele für dieses Gesetz des sinkenden Grenzertrags finden, welche über die zuvor genannten Punkte hinausgehen. So benötigen moderne Analysemethoden oft große Datenmengen, um eine hohe Präzision zu gewährleisten (denken Sie z.B. an die Klassifikation von Bildern). Der Zuwachs an Genauigkeit verringert sich dort jedoch ab einer gewissen Datenmenge. Abhilfe verschaffen können dann nur noch neue Algorithmen, die Verbindung verschiedener Methoden oder die Hinzuziehung von qualitativ andersartigen Daten, d.h. es muss über weitere Faktoren optimiert werden. Generell lässt sich somit sagen, dass die Wertschöpfungskosten mit der Datenmenge anwachsen, wodurch das Phänomen des sinkenden Grenzertrags weiter verschärft wird.

 

Immerhin: Der Wert von Daten lässt sich durch Mehrfachnutzung vervielfachen

Wir haben bislang einen kritischen Blick auf den Wert von Daten geworfen, was im Big Data Hype auf diese Weise viel zu selten passiert. Speziell die zuvor genannten Punkte zu Komplexität, Datenqualität und -frische müssen bei allen Investitionen rund um die Datenwertschöpfungsstrategie angesprochen werden. 

Glücklicherweise unterscheiden sich Daten schon alleine deshalb fundamental von Öl, weil sie prinzipiell unendlich oft verwendbar sind. Benutzt man ein und denselben Datensatz in verschiedenen Anwendungsfällen, so lässt sich der Wert eben jenes Datensatzes multiplizieren. Zum Beispiel kann ein Onlineshop über Kundeninteraktionsdaten die Nutzerführung optimieren, gleichzeitig marktforschungsrelevante Erkenntnisse gewinnen und zusätzlich jene Daten Dritten zur Verfügung stellen. Diese Art der Mehrfachnutzung kann die Limitierungen in der Datenwertschöpfung abschwächen.

5 1 vote
Article Rating
Abonnieren
Benachrichtige mich bei
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x