Et si notre monde était devenu incapable de s’adapter à l’innovation ? Deuxième partie
Cybersécurité : ne pas se tromper de combat

Maîtriser ses données : grand défi des prochaines années (Première partie)

 

AdS DPC barre bateau S 270637175La prise de conscience de l’importance des données numériques c’est accélérée depuis 2 ou 3 années. En 2021, la “donnée” est sur toutes les lèvres.

Deux événements qui ont eu lieu en France en janvier 2021 le confirment.

Le GAIA-X French Hub a tenu sa première conférence plénière le 22 janvier 2021, sous les auspices du CIGREF. J’ai suivi cette conférence en ligne qui a duré toute la matinée. Le support est disponible au format PDF.

La priorité a été clairement mise sur les données ; neuf domaines clés ont été identifiés tels que la santé, l’énergie ou l’agriculture.

Gaia-x 9 data spaces

Assises de la donnée 28:2:2021Les assises de la Data Transformation se sont tenues à Bercy le 28 janvier 2021 ; Bruno Lemaire, ministre des Finances, en a fait l’ouverture.

Cette conférence a duré toute la journée et j’ai pu en suivre une grande partie. L’essentiel des conférences est disponible sur ce lien.

L’avenir du numérique européen passe par la donnée pour GAIA-X. “Les données sont au cœur de notre relance économique” pour le ministre des Finances de la France.

Quelles belles ambitions, quels beaux projets !

AdS DPC small man vs big Man S 55968372Je travaillais sur ce billet pendant que je regardais ces deux conférences ; j’ai eu un moment le sentiment de me sentir “tout petit” avec mon objectif d’aider chaque entreprise à améliorer sa gestion des données. Parler des entreprises quand l’avenir de la France et de l’Europe dépend des données, ce n’était vraiment pas au niveau voulu...

Je suis rapidement revenu à la raison : gérer efficacement ses données est déjà un défi d’une exceptionnelle difficulté pour chaque entreprise, et prendra plusieurs années. Sur ce thème, je pense pouvoir apporter de la valeur.

Au niveau de la France ou de l’Europe ? Je préfère laisser cette activité à d’autres.

Ce billet a pour ambition d’aider, un peu, les entreprises à reprendre la maîtrise de leurs données.

 

Rappel : modèle B I S et modèle B I S D

(Pour les lecteurs qui ne sont pas familiers avec ces deux modèles.)

En 2015, j'ai proposé un modèle d’analyse du Système d’Information (SI) des entreprises, nommé B I S :

B = Business, cœur métier en français : les applications liées aux activités spécifiques de chaque entreprise.

I =  Infrastructures : serveurs, réseaux, postes de travail, les fondations d’un SI.

S = Support, les applications transverses, universelles que l’on rencontre dans la majorité des entreprises.

En 2019, j’ai fait évoluer ce modèle en ajoutant la dimension D, pour données ; il est devenu le modèle B I S D.

Modèle BISD - Infra  Soutien  Métiers -Data

Les missions d’accompagnement des entreprises dans leur Transformation Numérique que j’ai menées entre 2015 et 2019 ont confirmé que les données occupent une place centrale dans la nouvelle version de mon modèle.

 

Les données : un peu d’histoire

Cover 10 000 years of recorded information STout au début de ma carrière en informatique, j’ai eu l’honneur et le privilège de rencontrer et de travailler aux USA avec Paul Strassmann quand il était DSI de Xerox. Cet homme exceptionnel, né en Europe de l’Est, a immigré aux USA après l’invasion de son pays par les Russes à la fin de la Deuxième Guerre mondiale. Il a organisé pour Xerox une exposition remarquable sur “10 000 ans d’information enregistrée”. Le catalogue de cette exposition en présente quelques pièces exceptionnelles. C’est à ma connaissance la seule collection qui regroupe tous les moyens utilisés par l’humanité, dans toutes les civilisations, pour “enregistrer” des informations. Il est fascinant de voir comment, avec des techniques très différentes, les hommes ont, depuis 10 000 ans, cherché à mémoriser des données. L’une des pièces les plus rares (p 11) est l’un des seuls Quipus Péruviens restants, qui servait à enregistrer les… taxes. Les Espagnols avaient détruit systématiquement toutes ces “mémoires” pour effacer l’histoire du pays.

Aujourd’hui, l’immense majorité des données est mémorisée sous forme numérique. En 2021, les contraintes de volumes et de coûts ont disparu : il est possible de tout mémoriser. Comme le montre ce graphique, cette croissance des volumes de données est exponentielle ; on est passé entre 2010 et 2020 de 2 zettabytes à 60 zettabytes, une multiplication par 30.

Data stored from 2010 to 2024 - Zettabytes

Comment gérer efficacement ce déluge de données, qui ne fait que commencer ?

Je vous propose une démarche innovante qui, je l’espère, vous aidera à répondre à ce défi.

 

Les deux dimensions des données

Données dialogue SQL vs BudgetLorsque vous parlez de données à un professionnel du numérique, il pense immédiatement aux solutions disponibles.

Lorsque vous parlez de données avec les métiers, ils les voient sous la forme de contenus, financiers, humains ou autres.

C’est pour répondre à cette double vision des données qu’il est nécessaire d’avoir… une double réponse :

● La première, qui va proposer des solutions d’infrastructures numériques.

● La deuxième, qui parle des données dans le langage des métiers.

● Le défi, bien sûr, c’est de réconcilier les deux.

 

Dimension Infrastructures des données

J’ai participé à d’innombrables conférences, salons et séminaires où des professionnels du numérique parlent des données. Ce qui est fascinant pour moi, c’est que tout le monde se concentre sur un seul type de données, les données structurées.

Oui, les données structurées, utilisées en comptabilité, en finance, pour la gestion des ressources humaines ou des stocks sont importantes. Mais, en 2021, elles ne sont pas les seules à être numérisées, et ce sont celles qui occupent les plus petits volumes !

J’ai identifié six grandes familles de données :

● Les données structurées.

● Les documents bureautiques : textes, tableurs, présentations, PDF…

● Les modèles 3D, utilisés en ingénierie, construction…

● Les séries temporelles, que l’on rencontre aussi bien en finance que dans l’industrie.

● Les contenus multimédia : images, photos, vidéos…

● Les données géographiques : cartographie, routes, météo…

Vision Infrastructures données

L’ordre dans lequel elles sont présentées, de droite à gauche, n’est pas le fruit du hasard, comme on va le voir maintenant.

Remarque concernant les solutions citées : l’avenir des données est dans les Clouds Publics ou...dans les Clouds Publics. Toutes les solutions historiques, que l’on rencontre encore dans les centres de calcul privés que quelques rares entreprises “frileuses” continuent à gérer ont vocation à disparaître, et très vite. Je ne vais donc référencer que des solutions “natives cloud”.

C’est aussi un domaine où quelques fournisseurs attardés essaient de faire croire à leurs clients qu’ils ont LA solution universelle, intégrée, pour tous les types de données.

On retrouve ce combat entre les solutions “universelles” et les “best of breed” dans tous les domaines du numérique, et la gestion des données n’y fait pas exception.

Données structurées

Ce sont les données pour lesquelles il existe le plus de solutions techniques, et de très loin. Bases de données SQL, entrepôts de données, Data Lake… des centaines de logiciels sont disponibles pour gérer les données structurées. Ce sont aussi les solutions de gestion de ces données structurées qui sont les mieux connues par les informaticiens. Les formations à la gestion des bases de données sont presque exclusivement centrées sur ce thème.

La société de Capital Risque A16z (Andreessen Horowitz) a publié ce graphique qui présente son “Architecture Unifiée d’Infrastructures de Données.” Il est d’une grande complexité, liste des dizaines de solutions qui sont toutes…quelle surprise, dédiées aux données structurées.

A16z Unified Data Management Model

Données bureautiques.

Gdrive collaborationC’est la deuxième famille de données la plus utilisée dans les entreprises. Toutes les entreprises créent et gèrent des rapports, des présentations, des contrats… Il existe des solutions leaders dans ce domaine, venant :

● Des fournisseurs d’outils bureautiques cloud comme GDrive de Google ou OneDrive de Microsoft.

● De sociétés spécialisées comme Box ou Dropbox.

Il ne viendrait à l’idée de personne d’utiliser une base de données structurées SQL pour gérer tous ses documents.

Les quatre familles de solutions techniques qui suivent sont moins universelles que ces deux premières. Ce sont des données que l’on ne rencontre pas dans toutes les entreprises. Conséquence : le nombre de solutions “Cloud” disponibles pour ces familles de données est plus réduit.

Modèles 3D

Dassault 3D experienceLa numérisation de toutes les activités d'ingénierie est banalisée depuis des dizaines d’années. C’est l’un des rares domaines du numérique où la France a un champion mondial, Dassault Systèmes. Depuis plusieurs années, Dassault Systèmes a pris le virage du Cloud avec ses solutions 3ds.com. La mise à disposition des modèles 3D dans le Cloud permet à des collaborateurs sur le terrain d’y accéder depuis un navigateur.

Séries temporelles

Amazon timestreamÉvolution d’un cours de bourse, suivi de la vitesse de rotation d’un moteur, variation de la température dans un four… les domaines d’activités où l’on souhaite suivre l’évolution d’une donnée au cours du temps sont très nombreux. Il a fallu attendre longtemps avant de voir apparaître des solutions logicielles spécialisées pour gérer efficacement ces types de données, et elles sont encore peu nombreuses. Amazon Timestream, disponible sur AWS, n’est arrivé qu’en 2019.

Contenus multimédia

Pendant longtemps, les contenus multimédia, photos, images ou vidéos, ont été réservés à des métiers spécialisés comme la communication ou le marketing. Des dizaines de solutions DAM, Digital Asset Management, existent pour répondre à ces besoins spécifiques.

Il y a 2 ans, nous avons recherché avec une entreprise industrielle française une solution simple de gestion de contenus multimédia dans le Cloud pour permettre à tous les collaborateurs de partager ces contenus.

WizyVision exempleComme aucune solution satisfaisante n’était disponible, l’entreprise Wizy.io, dont je suis l’un des fondateurs, a développé un logiciel SaaS pour les contenus multimédia. C’est devenu le produit WizyVision DAC, Digital Asset Center. Je peux le définir comme le premier outil universel, natif Cloud, pour la gestion des contenus multimédia.

Données géographiques

Des milliers de services numériques utilisent la géolocalisation : Uber, CityMapper et même StopCovid !

Toutes les entreprises n’ont pas les moyens de Google, Apple ou Uber pour construire sur mesure des solutions métiers qui s’appuient sur des dimensions géographiques. Il existe depuis des années des outils qui répondent à ce besoin, mais ils sont chers, complexes et construits sur des architectures anciennes.

Bonne nouvelle : les toutes premières solutions Cloud natives arrivent. L’une des plus prometteuses est Unfolded.ai. Les fondateurs sont d’anciens collaborateurs d’Uber ; ils avaient construit leurs applications en créant des briques Open Source, Kepler.gl et Deck.gl.

Unfolded.ai on Open Source platforms

Unfolded.ai s’appuie sur ces composants Open Source, ce qui est un gage de qualité et de pérennité.

 

Dimension infrastructures : en résumé

Petit à petit, l’offre de solutions natives Cloud s’enrichit, pour répondre à toutes les attentes des entreprises pour gérer leurs données. Dans des domaines comme le multimédia ou les données géographiques, pour lesquels les demandes des entreprises avaient du mal à trouver des réponses modernes, les premières offres sont maintenant disponibles.

Vision Infrastructures données + solutions

Oui, les métiers de gestionnaires des infrastructures de données seront de plus en plus complexes, car il faudra maîtriser plusieurs outils logiciels.

C’est la seule option raisonnable à long terme, face à la tentation, suicidaire, d'espérer trouver la solution unique qui répondrait à toutes les attentes, actuelles et futures, des entreprises pour la gestion de toutes les familles de données dont elles ont besoin.

Matrice gestion données ancien monde nouveau mondeCette matrice à quatre cases permet de visualiser les évolutions nécessaires des entreprises dans leur démarche de gestion des données :

● La situation historique la plus fréquente : des outils universels installés dans des centres de calculs privés

● Deux cases sans avenir : outil universel dans le cloud et outils spécialisés dans centres de calcul privés.

● Le point d’arrivée moderne : des outils spécialisés dans le cloud public.

 

Usages

La situation est plus stable dans le domaine des usages : les métiers ont des attentes raisonnablement bien connues et pérennes.

Toutes les entreprises ont besoin d’information dans des domaines universels tels que :

● Clients.

● Ressources Humaines.

● Finances.

Il existe aussi des attentes spécifiques à certains secteurs d’activités :

● Gestion de production.

● IIoT : Industrial Internet of Things, informations sur les objets connectés.

Vision métiers données

Les limites techniques de l’informatique des années 1960 à 1990, les coûts très élevés des solutions de stockage avaient conduit les entreprises à avoir une stratégie de gestion de la pénurie et à considérer que l’octet était une ressource rare et chère. Les données structurées financières et bureautiques textuelles étaient les seules à pouvoir être stockées dans des supports numériques. L’exemple probablement le plus célèbre est celui des années ; on n’avait gardé que les deux derniers chiffres pour économiser des octets. Le passage à l’année 2000 a montré à quel point cette économie initiale avait été la source de coûts très élevés quand il a fallu passer à quatre chiffres.

L’explosion des usages d’Internet et du Web a fait naître des sources d’information nouvelles, externes à l’entreprise, telles que les réseaux sociaux et les sites Web ouverts à tous.

Données sources internes - externes 1990 - 2020Entre 1990, année du début du Web, et aujourd’hui, les volumes de données créées en interne ont augmenté, mais raisonnablement. À l’inverse, les entreprises ont vu croître très vite les données d’origine externe.

Les FLW, Front Line Workers, les travailleurs en première ligne, ont été pendant trop longtemps les oubliés de la Transformation Numérique. Leurs besoins de données numériques n’étaient pas prises en compte et le papier restait leur outil principal.

L’exemple que je vais présenter montre comment ces FLW peuvent en 2021 profiter de ces différentes sources de données pour transformer en profondeur leurs modes de travail.

AdS DPC FLW with smartphone factory S 354388167Cet exemple est celui d’un technicien qui doit mener une opération de maintenance sur une installation industrielle de grande taille. Comme tous les FLW, il est équipé d’un smartphone. Il peut :

● Localiser le lieu d’intervention par la cartographie.

● Arrivé sur place, une simple photo lui permet de retrouver, dans la base multimédia, les références du matériel à réparer.

● Toutes les données des maintenances préalables s’affichent automatiquement sur son écran, à partir d’une base de données structurées. Aucune saisie manuelle n’est nécessaire.

● Il peut consulter à tout moment, dans la base des documents, le manuel d’entretien.

● S’il diagnostique que le problème vient d’irrégularités dans la pression d’alimentation en air comprimé, un coup d’œil sur les évolutions de la pression au cours des 3 derniers mois dans la base temporelle lui permet de confirmer son intuition.

● Un accès aux plans 3D de l’installation lui montre sur quel composant il doit intervenir.

● À la fin de son intervention, quelques photos après réparation vont enrichir la base multimédia, ce qui aidera un autre technicien d’entretien lors d’une prochaine visite.

● Tout ceci est réalisé en mode numérique 100%, sans avoir besoin d’utiliser le moindre support papier pendant l’intégralité des étapes de son intervention.

L’application sur mesure qui a été développée pour ce FLW fait appel aux six solutions logicielles de gestion des données, de manière totalement transparente pour lui.

C’est aussi un bon exemple d’un double bénéfice “Gagnant Gagnant” :

● Pour le Front Line Worker, qui peut se concentrer sur ses activités à forte valeur ajoutée, sans perdre du temps sur des fonctions administratives.

● Pour l’entreprise, à qui ce nouveau processus 100% numérique garantit que toutes les informations, de toute nature, sont à  jour en permanence.

Cet exemple permet d’introduire la deuxième partie de ce billet ; il présentera les indépendances nécessaires à créer entre les composants d’un Système d’Information construit sur le modèle B I S D.

Commentaires