#19 Utilisation des données comme un atout stratégique

Subscribe to get the latest

on Mon Sep 07 2020 17:00:00 GMT-0700 (Pacific Daylight Time)

with Darren W Pulsipher,

Dans cet épisode, Darren Pulsipher, architecte en chef des solutions chez Intel pour le secteur public, explore comment les organisations peuvent passer d'une simple accumulation de données à leur utilisation en tant qu'actif stratégique.


Keywords

#dataarchitecture #data #datastrategy #people #process


is a lot, but I have a hard time deleting anything because I’m always worried I might need it later. However, hoarding data can have negative consequences. It can make it harder to find information when you need it, and it can also make systems run slower. It’s important for organizations to regularly clean out and organize their data to prevent these issues.

Il n’a pas besoin d’être si grand, mais je sauvegarde des choses au cas où j’en aurais besoin. Maintenant, multipliez cela par le nombre d’employés. Chez Intel, nous avons cent mille employés. Imaginez la quantité de données que nous stockons, rien qu’avec les emails, lorsque nous faisons des sauvegardes. Ajoutez-y les bases de données structurées et non structurées, les présentations, les feuilles de calcul, etc… et il est clair que tout stocker n’est pas une bonne stratégie.

Statistiques de données

Jetons un coup d’œil aux statistiques qui montrent pourquoi cette stratégie est mauvaise. Environ 80 % du temps des scientifiques des données est consacré au nettoyage des données avant de pouvoir les utiliser. Moins de 50 % des données structurées sont utilisées, et moins de 1 % des données non structurées peuvent être analysées. Ainsi, toutes ces données sont accumulées, mais les organisations ne les utilisent pas, pour la plupart. Un autre problème est de savoir qui a accès à toutes ces données stockées. Il est alarmant que 70 % des employés aient accès à des données auxquelles ils ne devraient probablement pas avoir accès. Tout comme les tas de choses d’un hoarder créent des risques d’incendie dans une maison, les tas de données non organisées créent des risques de sécurité dans une organisation.

Explosion de données

Que pouvons-nous faire à propos de ce problème ? Tout d’abord, nous devons comprendre pourquoi il y a une telle explosion de données. Avec l’IoT, tout est connecté, et nous avons des traitements de données qui se produisent dans une multitude d’endroits. Le volume énorme de données qui est généré est incroyable. Cela est exacerbé par des problèmes réglementaires ; il est difficile de savoir ce que nous pouvons éliminer et ce que nous ne pouvons pas. Nous remplissons nos espaces de stockage et ensuite en achetons davantage. La technologie permet essentiellement notre accumulation de données. Nous devons examiner ce que nous pouvons faire différemment.

Pourquoi nous accumulons.

Les experts disent que les gens accumulent parce qu’ils croient qu’un objet sera utile ou précieux à l’avenir, qu’il a une valeur sentimentale, qu’il est unique et irremplaçable, ou qu’il représente une trop bonne affaire pour être jeté. Ces mêmes idées s’appliquent à l’accumulation de données. Par exemple, pourquoi ai-je encore l’une des premières présentations que j’ai jamais faites ? Elle est stockée sur un disque et dans le cloud. Je la regarde peut-être une fois par an, mais je n’ai aucune raison valable en dehors de sa valeur sentimentale pour la conserver. Une organisation est composée d’individus ayant ces comportements, et à tous les niveaux d’accumulation de données, il y a la peur de se débarrasser des données.

Devenir centré sur les données

À quoi cela ressemble-t-il de devenir une entreprise axée sur les données plutôt qu’une entreprise de stockage ? Voici un processus en quatre étapes pour devenir une organisation axée sur les données.

Fondement organisationnel

La première étape consiste à créer une base organisationnelle centrée sur les données. Il y a quatre acteurs clés avec des rôles distinctifs.

Directeur des données : Le rôle du directeur des données consiste à définir la stratégie et la gouvernance en matière de gestion des données et de génération d’informations précieuses pour l’entreprise. Ce rôle diffère de celui du directeur des systèmes d’information, qui se concentre sur l’infrastructure plutôt que sur l’information elle-même. C’est un travail difficile, car le directeur des données est impliqué dans le changement culturel. Il essaie d’empêcher les gens de stocker les données et encourage plutôt leur utilisation pour créer une véritable valeur commerciale.

Scientifique des données : Les scientifiques des données développent des modèles et des plans en trouvant des motifs dans les données et en utilisant des analyses prédictives. Les efforts des scientifiques des données ne peuvent devenir qu’une simple expérience scientifique ponctuelle, à moins que les informations ne soient opérationnalisées.

Ingénieur de données : C’est là que les ingénieurs de données interviennent. Ils gèrent les pipelines de données et opérationnalisent l’analyse. À mesure que de nouvelles données arrivent, de nouvelles connaissances sont générées sans recommencer à chaque fois.

Gardien des données : Le gardien des données gère la gouvernance et l’accès aux actifs de données, en veillant à ce que les bonnes personnes aient le bon accès au bon moment.

Avec une organisation qui comprend ces quatre rôles, la prochaine question importante est de savoir s’il faut centraliser ou distribuer les opérations. Par exemple, il se peut que la gestion matricielle distribuée fonctionne déjà dans votre grande organisation, mais une petite organisation pourrait avoir besoin de plus de rigueur et bénéficierait d’une structure plus centralisée.

Collecte et préparation des données.

Un article de la Harvard Business Review utilise efficacement une analogie sportive pour décrire deux stratégies de catalogage des données : la défense et l’attaque. En défense, l’objectif est de protéger les données. En attaque, l’objectif est d’avancer rapidement pour marquer des points.

Défense et Attaque de données

Avec une stratégie défensive, l’organisation se concentre principalement sur la sécurité des données, la gouvernance et la conformité. La protection des données est essentielle. L’activité principale de données sera centrée sur l’extraction, la normalisation, la gestion du stockage et la gestion des accès. En général, cette stratégie utilisera une organisation plus centralisée et une seule source de vérité.

Avec une stratégie offensive, l’organisation se concentre principalement sur la rapidité d’action afin d’améliorer sa position concurrentielle et d’être aussi rentable que possible. Les activités liées aux données porteront sur l’extraction, la modélisation, la visualisation, la transformation et l’enrichissement.

Cette stratégie nécessitera plus de flexibilité, ce qui signifie une organisation plus distribuée avec des versions multiples de la vérité.

Comprendre comment utiliser les données en fonction de la stratégie est important. Souvent, les organisations restent sur la défensive et cela peut être déroutant. Bien que chaque organisation ait besoin d’être capable de défendre et d’attaquer, les organisations doivent choisir une stratégie plutôt que de chercher à faire les deux, tout comme les joueurs de football de niveau professionnel ne jouent pas des deux côtés du ballon.

Analytique Perspicacité

Il existe une courbe de maturité organisationnelle pour les analyses et la génération d’informations à partir de vos données. La clé est de comprendre où se situe actuellement votre organisation et quelles sont les prochaines étapes pour progresser sur la courbe.

À l’étape de l’analyse descriptive, vous essayez simplement de comprendre ce qui se passe. À l’étape diagnostique, vous cherchez à comprendre pourquoi quelque chose s’est produit. À l’étape prédictive, vous pouvez prédire ce qui se passera à l’avenir en fonction des données historiques. C’est là que de nombreuses organisations aspirent à être, mais les deux premières étapes doivent être réalisées au préalable. Au-dessus de la prédiction se trouve la prescription, où vous pouvez comprendre pourquoi quelque chose se produira et guider l’organisation en fonction des attentes. Au sommet des étapes se trouve l’analyse des informations ou la prévoyance, où vous faites en sorte que les choses se produisent, progressant même au-delà de la prescription.

Une raison importante de comprendre la position actuelle de votre organisation est qu’il existe des outils spécifiques pour chaque phase. Par exemple, vous ne voulez pas vous retrouver coincé avec un projet d’IA qui utilise des algorithmes prescriptifs, voire prédictifs, lorsque votre organisation se situe encore à l’étape descriptive.

Opérationnalisez-le

Pour atteindre l’objectif de l’opérationnalisation, c’est-à-dire la création d’un processus répétable, il existe trois éléments clés : une infrastructure axée sur les données, des pipelines de données et un flux d’activité commerciale.

L’infrastructure axée sur les données vous permet de savoir où se trouvent toutes vos données et ce qu’il y a dans ces données grâce à divers outils tels qu’un gestionnaire de métadonnées comme Elastic Search ou des catalogues et des référentiels de métadonnées. Les pipelines de données disposent d’excellents outils pour permettre le processus depuis l’ingestion jusqu’à l’analyse et l’action. Une stratégie défensive ou offensive déterminera les outils que vous utiliserez dans votre pipeline. Le dernier élément, le flux d’activité commerciale, est là où la compréhension commerciale de vos données et de vos processus permettra le déploiement d’un processus d’amélioration continue pour garantir des informations reproductibles et précieuses.

Appel à l’action

Tout d’abord, développez une stratégie de données. Organisez-vous et identifiez où se trouvent toutes vos données et cataloguez-les. Décidez d’une stratégie défensive ou offensive, puis procédez étape par étape à l’analyse de vos informations en utilisant les bons outils. Surtout, mettez en œuvre vos connaissances pour en tirer la meilleure valeur commerciale.

Podcast Transcript