B I S D : la version 2 du modèle B I S
27/08/2019
En janvier 2015, il y a plus de 4 ans, j’ai publié sur ce blog un billet présentant le modèle B I S, une approche innovante pour définir les principaux composants d’un Système d’Information.
Ce modèle B I S est rapidement devenu une référence pour nombre d’entreprises innovantes. Il est aussi l’une des bases du livre que j’ai co-écrit avec Dominique Mockly, P-DG de Teréga :
Dirigeants, Acteurs de la Transformation Numérique
La mise en œuvre du modèle B I S m’a permis de réussir de nombreuses missions d’accompagnement de la Transformation Numérique d’entreprises. Mais, progressivement, je me suis rendu compte qu’une dimension majeure n’était pas prise en compte de manière satisfaisante par ce modèle : la gestion des données.
Je suis aujourd’hui convaincu que les entreprises doivent mettre les données au cœur de leur stratégie numérique et que le modèle B I S initial n’accordait pas suffisamment d’importance à cette dimension données.
Je vous propose, aujourd’hui, une version 2 du modèle B I S, qui ajoute cette dimension D, pour Données.
Il devient le modèle... B I S D.
Rappel : le modèle B I S, version initiale
(Pour les lecteurs qui ne sont pas familier avec le modèle B I S)
Les fondamentaux
Les trois composants du modèle B I S sont :
I = Infrastructures. Serveurs, réseaux, objets d’accès, les fondations d’un Système d’Information, sur lesquelles sont construits les usages.
S = Support. les usages universels, que l’on rencontre dans toutes les entreprises : messagerie, budgets, gestion des ressources humaines, achats…
B = Business (cœur métier en français). Les usages spécifiques d’une activité : équilibrage offre et demande d’énergie chez EDF, gestion des prêts immobiliers dans une banque, gestion des wagons pour la SNCF…
B I S et Cloud Public
Le Cloud Public est aujourd’hui la seule réponse pérenne pour construire un Système d’Information en s’appuyant sur le modèle B I S.
I : infrastructures. Les entreprises basculent leurs usages sur les solutions IaaS, Infrastructures as a Service, des grands acteurs mondiaux : AWS d’Amazon, Google GCP ou Microsoft Azure.
S : Usages Support. Pour 99 % des usages support il existe des solutions SaaS, Software as a Service. Des dizaines de milliers de solutions SaaS sont disponibles pour les usages support.
B : Business. L’offre de solutions SaaS verticales, spécialisées pour un métier, s’enrichit tous les jours. Quand les entreprises souhaitent créer de la compétitivité ou se différencier de leurs concurrents, elles construisent des applications sur mesure en utilisant les outils PaaS, Plateforme as a Service, disponibles dans le Cloud Public.
Comme le démontre ce graphique, les clouds publics peuvent accueillir tous les composants d’un Système d’Information, organisé autour du modèle B I S.
Le modèle B I S D
En relisant mon billet de 2015 qui présentait le modèle B I S, j’ai noté avec intérêt que l’un des premiers commentaires posait déjà la question… des données.
Avec un peu de retard, j’y répond, aujourd’hui !
Les trois composants du modèle B I S initial ne changent pas et leurs rôles restent identiques.
La composante D, Données, s’intercale entre les infrastructures et les usages.
L’objectif prioritaire est de donner leur indépendance aux données. Les données sont créées et utilisées par les applications, S et B, hébergées et gérées par les infrastructures, I. Les données n’appartiennent plus aux infrastructures ou aux usages, elles doivent avoir leur vie propre.
Donner leur indépendance aux données aura des impacts majeurs sur les choix d’architecture d’un Système d’Information ; ils sont présentés dans les prochains paragraphes.
Différentes familles de données, différents outils logiciels
Poser la question suivante à un informaticien : quels sont les outils à utiliser pour gérer des données. Dans la majorité des cas la réponse sera : une base de données SQL.
Oracle, SQL Server, MySQL et quelques autres seront les solutions les plus souvent citées.
Depuis plus de 30 ans, ces outils ont été utilisés dans les entreprises pour gérer des données structurées, et ils répondent très bien à cette demande.
Aujourd’hui, cette réponse n’est plus satisfaisante :
- La nature des données utilisées est devenue très variée.
- De nombreuses familles de données sont peu structurées.
- Utiliser un seul outil pour des familles de données différentes devient une aberration.
“Pour un marteau, tout devient un clou” : cette expression correspond très bien au réflexe de beaucoup de professionnels de la gestion des données. Je maîtrise très bien les bases de données SQL, je vais les utiliser pour toutes les familles de données.
Une fois de plus, privilégier l’unicité des solutions pour “simplifier la vie” des informaticiens est une très mauvaise idée.
Les entreprises auront de plus en plus besoin de gérer des données de natures très différentes.
Sans prétendre à l’exhaustivité, j’ai identifié six familles principales de données :
- Données numériques structurées : financières, commerciales, RH...
- Documents bureautiques : textes, tableaux, présentations…
- Données multimédia : photos, images, vidéos, sons…
- Séries temporelles : financières, techniques…
- Données géographiques : plans, cartes, représentations de réseaux de distribution…
- Données modèles 3D : ingénierie, aviation...
En 2019, la bonne démarche consiste à proposer un outil logiciel différent pour chacune de ces familles de données. Ce seront, bien sur, toutes des solutions dans les clouds publics !
Chaque entreprise devra sélectionner un ensemble de solutions de gestion de données qui répond le mieux possible à leurs besoins. Une banque n’aura pas besoin de choisir un outil de gestion de modèles 3D si elle n’en a pas l’usage.
Dans certains domaines, les offres sont bien connues et pérennes. C’est le cas des données structurées, des modèles 3D ou des documents bureautiques.
C’est plus difficile dans des domaines comme les données géographiques, temporelles ou multimédia. Les offres qui dominent aujourd’hui le marché ont été construites sur des architectures anciennes, le plus souvent client/serveur. Les solutions “natives cloud” sont peu nombreuses et, souvent, moins abouties. C’est particulièrement vrai pour la gestion des actifs multimédia : la grande majorité des solutions existantes DAM, Digital Asset Management, sont en fin de vie.
Double vision des données, infrastructures et usages
N’essayez pas d’expliquer aux collaborateurs de votre entreprise les avantages d’une démarche multi-solutions logicielles pour gérer les données de leur entreprise ; ce n’est pas leur préoccupation principale ! Comme pour tous les choix d’infrastructures, il faut accepter d’être “invisible” et que les métiers ne souhaitent qu’une chose, que les contraintes “techniques” n’interfèrent pas avec leurs usages.
Les métiers ont une vision… métier des données : ils souhaitent parler de clients, de salariés, de produits ou d’objets industriels.
Je vous propose un exemple simple pour illustrer cette double vision, technique et métiers, dans les ressources humaines. Le responsable RH de l’entreprise souhaite “tout savoir” sur Louis Naugès :
- Sa date d’entrée dans l’entreprise et son salaire : ces données seront dans des bases structurées SQL.
- Une photo récente : elle est dans la base multimédia.
- Le support qu’il a utilisé pour la présentation de l’entreprise aux nouveaux embauchés ; il est dans la base des documents bureautiques.
Répondre de manière transparente à cette requête est tout sauf simple, mais les équipes d’infrastructures données devront être capables de le faire.
Un lien entre ces deux visions : le catalogue de données
Etre capable de trouver et accéder les données dont on a besoin, à un instant donné, pour un usage donné spécifique, en toute transparence et sans avoir à connaître les moyens techniques utilisés pour les gérer, c’est un défi majeur auquel toutes les entreprises vont se confronter dans les années qui viennent.
La démarche que je propose est de créer un catalogue de données de nouvelle génération, capable d’établir un pont transparent entre la vision métiers et la vision technique des données.
Ce sera tout sauf simple : le client principal de ce catalogue de données est un collaborateur de l’entreprise, sans compétences particulières en informatique, qui souhaite :
- Savoir quelles sont les données disponibles qui pourraient l’intéresser.
- Y accéder facilement.
- Les visualiser, rapidement, dans son navigateur favori.
Metadata, Intelligence Artificielle, souplesse, ergonomie orienté en priorité vers les clients internes et externes du SI, tout reste à inventer aujourd’hui pour créer ces nouveaux outils de gestion de catalogues de données.
Je n’ai pas encore trouvé de solutions SaaS catalogue de données qui répondent bien à ces besoins. Dans une première étape, les entreprises qui souhaitent les mettre en œuvre devront s’appuyer sur des équipes de développement internes pour les construire.
Je prédis un succès exceptionnel au premier éditeur de logiciels capable de proposer un outil SaaS universel pour créer un catalogue de données.
Responsable les données : un métier d’avenir
Difficile d’utiliser CDO, Chief Data Officer, pour définir ce métier ; ces initiales évoquent le métier de Chief Digital Officer. Il faudra trouver un autre acronyme !
DMO, Data Management Officer pourrait être une option, similaire à PMO, pour la gestion des projets.
N’hésitez pas à me proposer d’autres options.
Bien au delà des fonctions actuelles d’administrateur de bases de donnés, ce nouveau métier demande des doubles compétences, techniques et métiers.
Comprendre et maîtriser toute la richesse et la variété des données d’une entreprise, gérer ce capital donnée dans la durée, le faire vivre et évoluer en permanence, assurer une veille technologique pour profiter des innovations majeures qui vont arriver dans ces domaines… ce nouveau métier a des potentiels majeurs.
Aux premières personnes qui vont participer à la création de ce poste, capables d’en comprendre les défis et les potentiels, je prédis un avenir professionnel radieux !
Résumé
Le capital données est aujourd’hui un actif essentiel de toutes les entreprises. Elles doivent en reprendre le contrôle et gérer leurs données de manière aussi indépendante que possible des infrastructures, des applications et des fournisseurs.
En ajoutant la dimension D au modèle B I S initial, le modèle B I S D a pour ambition d’aider les entreprises à être encore plus performantes dans leur Transformation Numérique.
Je reprends la célèbre devise des mousquetaires en l’adaptant au monde des données de l’entreprise :
La donnée au service de tous, tous au service de la donnée
Dans une prochaine série de billets, je reviendrai sur ces thèmes de l’indépendance et du contrôle de leur destin numérique par les entreprises.
Encore un article très intéressant, mais je ne partage pas votre vision 100% cloud, spécialement quand on parle de données 3D ou multimédia.
Ces données engendrent très vite des volumes considérables et les stocks en cloud me semble une hérésie même à l'heure de la fibre optique. Si tout le monde faisait ça les tuyaux seront vite saturés !
Concernant votre idée de catalogue de donnée, je verrais cela comme une sorte de moteur de recherche privé, avec aperçu des documents quels que soit leur format, mais pouvant mixer des infras cloud public et privé ou serveur de fichier traditionnel.
Pour ma part, je soulignerais aussi la problématique de la qualité et de la fraicheur des données, car on voit bien qu'en entreprise on est très vite saturés par les N versions d'un même fichier, les dossiers archives des dossiers OLD des sauvegardes .... qui ne seront jamais ouverts etc... D'où effectivement un grand besoin de gouvernance sur les données pour ne pas risquer de se noyer dans un data lake devenu data ocean !
Qualité à la source, gestion du versioning, de l'archivage, de la suppression, des droits de consultations sont autant de thématiques qui seront chères aux DMO.
Rédigé par : Nicolas Fabre | 27/08/2019 à 21:31
Bel article comme d’habitude. Il est vrai que la partie data complète parfaitement le modele BIS.
Sinon comme exemple de DaaS (SaaS Catalogue de données) est Palantir. Qui est leader aujourd’hui.
Rédigé par : Chabane REFES | 28/08/2019 à 01:10
@ Chabane
Merci pour votre commentaire.
Palantir est une solution intéressante, mais qui, à mon avis, ne répond pas à mes demandes :
- Beaucoup trop chère pour être proposée à tous les collaborateurs
- Très spécialisée sur les données structurées.
- Une ergonomie adaptée à des professionnels de la donnée, pas à un collaborateur non spécialiste.
Rédigé par : Louis Nauges | 28/08/2019 à 12:40
@Nicolas
Vous posez beaucoup de bonnes questions, merci.
Données Multimédia et 3D : c'est justement en utilisant des solutions Cloud que l'on peut réduire les flux. La mise à jour d'une maquette 3D se fera sur le Cloud et ne demandera pas de transférer le modèle complet. Dassault Systèmes, leader mondial des données 3D, propose maintenant ses solutions dans le Cloud.
La démarche "Edge Computing" permet aussi de répondre à ces problèmatiques ; il est possible d'exporter, depuis le Cloud public vers des serveurs locaux, données et traitements dans un environnement local, industriel par exemple, pour répondre à des contraintes de latence ou de risques de coupures de réseaux.
Le catalogue de données est effectivement l'équivalent d'un moteur de recherche données internes, mais avec des performances et des contraintes spécifiques, en particulier en matière de sécurité et de gestion des droits d'accès et de modification.
La gestion de la "vie des données" dans le temps est aussi un grand challenge et j'ai prévu de traiter le sujet dans un prochain billet. Il y a des domaines, comme l'industriel, où l'on a besoin de garder des données temporelles pendant des dizaines d'années.
Rédigé par : Louis Nauges | 28/08/2019 à 12:48
Je rebondis sur l’objectif de donner leur indépendance aux données. Cette préoccupation n’est pas nouvelle et s’illustre dans bon nombre de Plan d’Occupation des Sols avec des zones de Gisements de données et de Référentiels.
La question ici est comment j’aborde la question des données dans le cadre de BIS et de son offre cloud correspondante. La réponse n’est pas, il me semble, clairement apportée mais, si je comprends bien, vous dites qu’ici, IaaS, PaaS, SaaS, tout est valable.
Là où je vous suis moins c’est concernant cette notion de catalogue de données qui apparait bien différents d’un catalogue de données tel qu’on l’envisage en urbanisation du SI. Ici, il est plus question d’un metamoteur de reconstitution des données (tel qu’un exalead pour rester chez Dassault) ?
Rédigé par : Anthony | 01/10/2019 à 10:31
@Antony
SUr ces thèmes complexes, je comprends vos interrogations.
Je connais bien Exalead, qui est une excellente solution.
Ce dont je parle est très différent : il s'agit d'une interface ergonomique entre les équipes techniques et les métiers permettant de retrouver toutes les informations dont on a besoin, quelles que soient leur nature.
Il existe des solutions pour les données structurées, très peu pour les autres familles de données.
Rédigé par : Louis Nauges | 02/10/2019 à 22:27
Article très intéressant
Si je voulais être un brin provoquant, est-ce que l'ERP ou Progiciel intégré n'exerce pas actuellement cette fonction de catalogue de données en proposant "une vue à 360°" du client, du fournisseur ou de l'employé...
Si j'évoque cette question c'est que la tentation est grande de conserver un ERP - référentiel des données des l'entreprise. l'ERP est installé et concentre une partie conséquente des données structurées de l'entreprise. Son démantèlement n'est pas une mince affaire (voir votre excellent article sur la DSI artisan-boucher).
Les autres applications réutilisent alors les données de l'ERP et produisent à leur tour leur propres données.
Et la tache de catalogue de données est souvent dévolue à l'outil de BI qui va devoir se charger en bout de course de réconcilier le tout.
On retrouve la démarche SoR, SoE, SoI (Systems of Record, Systems of Engagement, Systems of Intelligence) évoquée dans un autre de vos billets, et on bute toujours sur comment mettre à disposition des SoE les datas dont ils ont besoin (tiens, Attunity a été racheté par Qlik)
Rédigé par : Fabien | 26/10/2019 à 22:01
@ Fabien,
Vous posez beaucoup de questions pertinentes, merci.
Les ERP sont nés il y 30 ans avec l'ambition de permettre un partage des données de l'entreprise par tous ; personne ne peut être contre une telle idée.
La réalité est toute autre : cette vision ne c'est jamais concrétisée et les nombreux rachats de solutions concurrentes, traditionnelles et SaaS par les deux éditeurs ERP leaders, SAP et Oracle, ne fait que compliquer la situation.
Les entreprises sont en plus exposées maintenant aux comportements "mafieux" de ces éditeurs qui s'approprient les données de leurs clients et veulent faire payer les accès. Le cas emblématique est celui de SAP avec ses "accès indirects" : un collaborateur qui n'utilise pas un logiciel SAP doit payer pour accéder aux données de son entreprise. On marche sur la tête !
Merci aussi de faire référence à mes autres billets de blog, tels que SoR, SoE ou Soi.
Le nouveau modèle B I S D permet de répondre, raisonnablement bien, à ces défis. Les SoR, Systems of Record, deviennent des sources de contenus qui seront exploités par les SoE et Soi.
Les difficultés augmentent avec l'arrivée des données de nature différentes, structurées, bureautique, Multimedia...qui demandent des logiciels différents pour être gérées efficacement.
Reprendre la maîtrise de ses données est l'un des plus grands défis des 5 prochaines années ; il y aura encore beaucoup de travail, passionnant, pour les professionnels du numérique qui acceptent de s'attaquer à ces défis.
Rédigé par : Louis Nauges | 27/10/2019 à 09:43