#19 Die Verwendung von Daten als strategischem Vermögenswert
Subscribe to get the latest
on 2020-09-08 00:00:00 +0000
with Darren W Pulsipher,
In dieser Episode untersucht Darren Pulsipher, Intel Chief Solution Architect für den öffentlichen Sektor, wie Organisationen den Übergang von der reinen Anhäufung von Daten zur Nutzung als strategischem Vermögen bewerkstelligen können.
Keywords
#dataanalytics #operationalization #multicloud
is excessive, but I can’t bring myself to delete any emails. I fear that I might need them in the future. However, hoarding data can have negative consequences. It can lead to storage issues, slow down systems, and make it difficult to find the necessary information. Therefore, it is important for organizations to implement data management strategies to prevent data hoarding and ensure efficient operations.
Muss nicht so groß sein, aber ich speichere Dinge für den Fall, dass ich sie brauche. Multipliziere das jetzt mit der Anzahl der Mitarbeiter. Bei Intel haben wir hunderttausend Mitarbeiter. Stell dir vor, wie viele Daten wir speichern, allein in E-Mails, wenn wir Sicherungen machen. Dazu kommen strukturierte und unstrukturierte Datenbanken, Präsentationen, Tabellenkalkulationen usw. Es ist klar, dass es nicht nur eine gute Strategie ist, alles zu speichern.
Datenstatistik
Lassen Sie uns die Statistiken betrachten, die zeigen, warum dies eine schlechte Strategie ist. Etwa 80 Prozent der Zeit von Datenwissenschaftlern wird damit verbracht, Daten aufzubereiten, bevor sie sie verwenden können. Weniger als 50% der strukturierten Daten werden überhaupt genutzt, und weniger als 1% der unstrukturierten Daten können analysiert werden. Also werden all diese Daten gehortet, aber die Organisationen nutzen sie größtenteils nicht. Ein weiteres Problem ist, wer Zugriff auf all diese gespeicherten Daten hat. Es ist alarmierend, dass 70% der Mitarbeiter Zugriff auf Daten haben, auf die sie wahrscheinlich keinen Zugriff haben sollten. Genau wie die Stapel eines Sammlers Brandgefahren im Haus schaffen, stellen unorganisierte Datenhaufen Sicherheitsrisiken in einer Organisation dar.
Datenexplosion
Was können wir gegen dieses Problem tun? Zuerst müssen wir verstehen, warum es zu einer derartigen Datenexplosion kommt. Mit dem Internet der Dinge (IoT) ist alles miteinander verbunden, und wir haben Datenverarbeitung an verschiedenen Orten. Das schiere Volumen an generierten Daten ist unglaublich. Dies wird durch regulatorische Fragen verschlimmert; es ist schwer zu wissen, was wir loswerden können und was nicht. Wir füllen unseren Speicherplatz und kaufen dann mehr. Die Technologie ermöglicht im Grunde genommen unsere Datensammlung. Wir müssen uns anschauen, was wir anders machen können.
Warum wir horten
Experten sagen, dass Menschen hamstern, weil sie glauben, dass ein Gegenstand in der Zukunft nützlich oder wertvoll sein wird, einen sentimentalen Wert hat, einzigartig und unersetzbar ist oder ein zu gutes Schnäppchen ist, um es wegzuwerfen. Diese gleichen Ideen gelten auch für das Datenhamstern. Zum Beispiel, warum habe ich eine der ersten Präsentationen, die ich jemals gehalten habe? Sie ist auf einem Laufwerk gespeichert und in der Cloud. Ich schaue sie vielleicht einmal im Jahr an, aber ich habe keinen wirklichen Grund, sie außer dem sentimentalen Wert aufzubewahren. Eine Organisation besteht aus Individuen mit diesen Verhaltensweisen und auf allen Ebenen des Datenhamsterns gibt es die Angst, Daten loszuwerden.
Werde datenzentriert.
Wie sieht es aus, ein datenzentriertes Unternehmen anstelle eines Speicherunternehmens zu werden? Hier ist ein vierstufiger Prozess, um eine datenzentrierte Organisation zu werden.
Organisatorische Grundlagen
Der erste Schritt besteht darin, eine datenzentrierte organisatorische Grundlage zu schaffen. Es gibt vier Schlüsselakteure mit unterschiedlichen Rollen.
Chief Data Officer: Die Aufgabe des Chief Data Officers besteht darin, die Strategie und Regulierung für das Datenmanagement und die Generierung wertvoller Geschäftsinformationen festzulegen. Diese Rolle unterscheidet sich von der des Chief Information Officers, der sich mehr auf die Infrastruktur als auf die Informationen selbst konzentriert. Dies ist eine anspruchsvolle Aufgabe, da der Chief Data Officer in den kulturellen Wandel involviert ist. Sie versuchen, Menschen davon abzuhalten, Daten anzuhäufen, und stattdessen diese zur Schaffung realen Geschäftswerts zu nutzen.
Data Scientist: Data-Scientisten entwickeln Modelle und Entwürfe, indem sie Muster in den Daten finden und prädiktive Analysen verwenden. Die Bemühungen der Data-Scientisten können jedoch einfach nur zu einem einmaligen wissenschaftlichen Experiment werden, es sei denn, die Informationen werden operativ umgesetzt.
Daten-Ingenieur: Hier kommen Daten-Ingenieure ins Spiel. Sie verwalten Datenpipelines und implementieren Analysen in der Praxis. Mit dem Eintreffen neuer Daten werden neue Erkenntnisse generiert, ohne jedes Mal von vorne anzufangen.
Data-Steward: Der Data-Steward verwaltet die Verwaltung und den Zugriff auf Datenassets und stellt sicher, dass die richtigen Personen zum richtigen Zeitpunkt den richtigen Zugang haben.
Mit einer Organisation, die diese vier Rollen einschließt, ist die nächste große Frage, ob die Operationen zentralisiert oder verteilt werden sollen. Zum Beispiel funktioniert möglicherweise bereits ein verteiltes Matrixmanagement in Ihrer großen Organisation, aber eine kleinere Organisation benötigt möglicherweise mehr Struktur und würde von einer stärker zentralisierten Struktur profitieren.
Datensammlung und -vorbereitung
Ein Artikel der Harvard Business Review verwendet effektiv eine Sportanalogie, um zwei Strategien zur Katalogisierung von Daten zu beschreiben: Verteidigung und Angriff. Bei der Verteidigung geht es darum, die Daten zu schützen. Beim Angriff geht es darum, schnellstmöglich voranzukommen, um Punkte zu erzielen.
Datenverteidigung und -angriff.
Mit einer defensiven Strategie konzentriert sich die Organisation hauptsächlich auf Datensicherheit, -verwaltung und -compliance. Der Schutz der Daten steht im Vordergrund. Die Hauptaktivität im Bereich Daten wird auf Extraktion, Standardisierung, Speicherverwaltung und Zugriffsverwaltung basieren. Typischerweise wird bei dieser Strategie eine stärker zentralisierte Organisation verwendet und es wird eine einzige Datenquelle verwendet.
Mit einer offensiven Strategie konzentriert sich die Organisation in erster Linie darauf, sich schnell zu verbessern und eine möglichst profitable Wettbewerbsposition einzunehmen. Die Datenaktivitäten werden auf Extraktion, Modellierung, Visualisierung, Transformation und Anreicherung ausgerichtet sein.
Diese Strategie erfordert mehr Flexibilität, was eine stärker verteilte Organisation mit mehreren Wahrheitsversionen bedeutet.
Das Verständnis, wie man die Daten basierend auf der Strategie verwendet, ist wichtig. Oftmals sind Organisationen unschlüssig und es kann verwirrend werden. Obwohl jede Organisation in der Lage sein muss, sowohl Abwehr als auch Angriff zu spielen, muss sie eine Strategie wählen, anstatt beides zu versuchen, genau wie professionelle Fußballspieler nicht auf beiden Seiten des Balls spielen.
Analystisches Verständnis
Es gibt eine organisatorische Reife-Kurve für Analytics und die Generierung von Erkenntnissen aus Ihren Daten. Der Schlüssel liegt darin zu verstehen, an welchem Punkt Ihre Organisation derzeit steht und welche nächsten Schritte erforderlich sind, um auf der Kurve voranzukommen.
In der Phase der deskriptiven Analytik versuchen Sie einfach herauszufinden, was vor sich geht. Im diagnostischen Schritt finden Sie heraus, warum etwas passiert ist. Im prognostischen Schritt können Sie basierend auf historischen Daten vorhersagen, was in Zukunft passiert. Hier streben viele Organisationen danach zu sein, aber die ersten beiden Schritte müssen zuerst erledigt werden. Über dem prognostischen Schritt liegt das präskriptive Stadium, in dem Sie verstehen können, warum etwas passieren wird und die Organisation entsprechend den Erwartungen führen können. An der Spitze der Schritte steht die analytische Erkenntnis oder Vorhersehung, wo Sie Dinge geschehen lassen, sogar über die Verordnung hinaus voranschreiten.
Ein Grund, warum es wichtig ist, zu verstehen, wo Ihre Organisation derzeit steht, besteht darin, dass es für jede Phase spezifische Tools gibt. Zum Beispiel möchten Sie nicht in einem KI-Projekt stecken bleiben, das präskriptive oder sogar prädiktive Algorithmen verwendet, wenn Ihre Organisation noch im beschreibenden Schritt ist.
Es operationalisieren
Um das Ziel der Operationalisierung oder der Schaffung eines wiederholbaren Prozesses zu erreichen, gibt es drei Schlüsselelemente: eine datenzentrierte Infrastruktur, Datenpipelines und Geschäftsabläufe.
Die datenzentrische Infrastruktur ermöglicht es Ihnen zu wissen, wo sich alle Ihre Daten befinden und was sich in diesen Daten befindet, durch verschiedene Tools wie z.B. einem Metadaten-Manager wie Elastic Search oder Metadaten-Katalogen und -Repositories. Datenpipelines verfügen über großartige Tools, um den Prozess vom Eingang bis zur Analyse und zur Aktion zu ermöglichen. Eine defensive oder offensive Strategie bestimmt, welche Tools Sie in Ihrer Pipeline verwenden werden. Das letzte Element, der Geschäftsfluss, ist dort, wo das geschäftliche Verständnis Ihrer Daten und Prozesse die Bereitstellung eines kontinuierlichen Verbesserungsprozesses ermöglicht, um wiederholbare, wertvolle Erkenntnisse sicherzustellen.
Aufruf zur Tat
Als erstes sollten Sie eine Datenstrategie entwickeln. Organisieren Sie sich und finden Sie heraus, wo sich all Ihre Daten befinden, und katalogisieren Sie diese. Entscheiden Sie sich für eine defensive oder offensive Strategie und gehen Sie dann schrittweise bei der Analyse vor, wobei Sie die richtigen Werkzeuge verwenden. Am wichtigsten ist es, Ihre Erkenntnisse in die operative Praxis umzusetzen, um den größtmöglichen Geschäftswert zu erzielen.