Data Voices Connect : réservez votre place pour assister aux prises de paroles de leaders inspirants et échanger entre pairs sur l’avenir de la donnée.

Je m'inscris
Language

Garantir des données AI-ready – recommandations de Gartner

Data marketplace

Shadow technology increases risks, costs and undermines corporate IT governance. How can organizations overcome the challenge, particularly when it comes to protecting and sharing data across the business?

Professional smiling woman in a business meeting with a consultant, featuring the Gartner logo.

La disponibilité de données fiables et de haute qualité est indispensable pour le passage à l’échelle des projets IA. L’incapacité à fournir des données AI-ready conduit à des résultats incohérents et peu fiables, à un investissement gaspillé et à une baisse de la performance commerciale.

Les problèmes liés aux données ont un impact sur les modèles IA et freinent le succès de l’IA agentique. Des problèmes encore plus graves peuvent survenir, tels que des décisions incohérentes et des actions incorrectes qui se propagent alors rapidement dans votre entreprise et votre écosystème. Alors que les organisations cherchent à automatiser des flux de travail métier complexes via des agents, un accès fluide à des données de haute qualité est essentiel. 

Pour aider à construire et exécuter des stratégies de données AI-ready, Gartner a publié une série de rapports et de bonnes pratiques. Voici notre synthèse des dernières réflexions du cabinet d’analystes.

La donnée : le fondement d’une stratégie IA efficace

Comprendre les besoins spécifiques de l’IA

Il ne suffit pas de mettre simplement les actifs de données existants à la disposition des modèles et des agents IA. Ils doivent répondre à des exigences strictes en matière de qualité, mais aussi être concentrés sur les besoins spécifiques de l’IA. Gartner souligne trois domaines clés interconnectés :

  • Aligner les données : Les données doivent être bien structurées, précises et accessibles. Pour se protéger contre les biais et l’incohérence, elles doivent être dignes de confiance, annotées et labellisées correctement. Cela nécessite des métadonnées cohérentes et complètes ainsi qu’une couche sémantique et de contexte pour faire le pont entre les données brutes et l’IA (et les utilisateurs humains).
  • Adopter une gouvernance agile : Une gouvernance forte est vitale pour garantir que les données utilisées pour l’IA sont partagées de manière responsable, et en conformité avec les normes éthiques et juridiques. Cela signifie qu’elles doivent être entièrement documentées et que toute donnée sensible doit être protégée, avec des processus en place pour limiter l’accès aux cas d’usage d’IA pertinents, sans mettre en place de barrières inutiles qui ralentiraient l’adoption.
  • Qualifier en continu : Les données évoluent et changent, ce qui peut potentiellement impacter les résultats de l’IA au fil du temps. Cela nécessite une surveillance continue et une évaluation de facteurs tels que la cohérence pour s’assurer qu’elles restent pertinentes et valides pour chaque nouveau cas d’usage.

 

"Les données AI-ready sont des données dont la pertinence pour un cas d'usage spécifique peut être prouvée de manière contextuelle, continue, et par rapport aux exigences techniques du cas d'usage."

Mark Beyer, Roxane Edjlali, Gartner

Les défis de l'IA agentique

Les agents IA apportent de nouveaux défis. Les données sont ingérées en continu et en temps réel, ce qui signifie que les flux de données doivent être autonomes, coordonnés et fiables. L’IA agentique nécessite une gouvernance plus stricte et plus automatisée pour garantir la fiabilité et le contrôle à grande échelle.

Cette complexité peut freiner le déploiement des agents IA. Selon McKinsey, près de deux tiers des organisations dans le monde ont expérimenté des agents, mais moins de 10 % les ont passés à l’échelle pour générer une valeur tangible.

Quels sont les obstacles pour produire des données AI-ready ?

Les recherches de Gartner soulignent que la disponibilité et la qualité des données constituent le principal obstacle à l’IA, 30 % des CDOs les classant parmi les trois problèmes majeurs. Cela est confirmé par d’autres statistiques : huit entreprises sur dix dans une étude de McKinsey ont souligné que les limitations des données étaient un défi pour le passage à l’échelle de l’IA agentique.

La disponibilité et la qualité ne sont pas les seuls obstacles : le contexte et la gouvernance freinent également le succès.

Le contexte

Lorsqu’il s’agit de données, il est crucial de comprendre que les humains et l’IA perçoivent l’information différemment. Les humains utilisent leurs connaissances et leur expérience pour donner du contexte aux données qu’ils voient. Ils comblent les lacunes et reconnaissent immédiatement ce que les données représentent et voient quand quelque chose ne va pas.

L’IA n’a pas cette capacité innée d’ajouter du contexte aux données qu’elle consomme. Elle voit les données comme complètes et neutres, et base ses actions sur les données qu’elle reçoit.


La gouvernance

De nombreuses architectures de données existantes se concentrent à juste titre sur la protection des données, mais au prix de ce que Gartner appelle l' »inertie ». Essentiellement, les données ne sont pas rendues disponibles en temps opportun en raison de préoccupations concernant la conformité et la sécurité, l’infrastructure technique freinant le partage sécurisé, en particulier en dehors des experts techniques.

Comment mettre en place une stratégie AI-ready ?

Gartner souligne que la gestion des données doit s’étendre pour répondre aux besoins de l’IA. Cela nécessite une infrastructure en trois parties :

  1. Fondations traditionnelles de data management : les data lakes, la gouvernance des données et le data lineage.
  2. Capacités avancées de gestion des données : le data fabric, le DataOps, le data mesh et les data product.
  3. Techniques spécifiques à l’IA : l’étiquetage des données, l’enrichissement des données et l’atténuation des biais de données.

En s’appuyant sur cela, les données prêtes pour l’IA, en particulier pour les agents, nécessitent deux composants clés : le contexte et l’accès en libre-service.

La couche de contexte

La couche de contexte est l’infrastructure partagée qui se situe entre les données brutes et les modèles et agents d’IA. Elle intègre les règles métier, les relations et les processus opérationnels nécessaires pour interpréter correctement les données. 

Le context layer combine métadonnées, lignage, signaux de qualité, historique des décisions et politiques de gouvernance pour capturer : 

  • ce que les données représentent, 
  • comment elles sont utilisées dans l’entreprise, 
  • comment elles sont utilisées au fil du temps. 


Accès aux données via les data product et les data product marketplaces

Les données de haute qualité et contextualisées ne génèrent pas de valeur si elles ne sont pas ensuite découvertes et consommées par les agents et modèles IA. Elles doivent être transparentes et dignes de confiance, afin que l’IA sache qu’elles répondent à ses exigences et puisse facilement les ingérer en temps réel.

Ce besoin pressant entraîne l’essor des data products sélectionnés et conçus pour répondre à un besoin métier spécifique. Cependant, la simple création de data products ne garantit pas qu’ils seront utilisés. 

Les organisations se tournent donc vers les data product marketplaces pour fournir un point d’accès centralisé. Grâce à une expérience intuitive en libre-service, les data marketplaces connectent l’IA et les humains à des données pertinentes, fiables et contextualisées, stimulant l’utilisation et la valeur. La sécurité et la gouvernance sont appliquées grâce à des contrôles d’accès granulaires, garantissant que les données sont utilisées conformément aux politiques de l’entreprise et aux réglementations.

Dans une étude récente qui a cité Huwise comme fournisseur représentatif, Gartner déclare que les data marketplaces sont essentielles pour les organisations qui cherchent à maximiser leur retour sur investissement, à transformer les données en un actif stratégique en brisant les silos et à offrir un partage sécurisé et évolutif des data products.

"Le succès de la Data et de l'Analytics en 2030 ne dépend pas de meilleurs modèles, mais du fait de donner aux agents un accès gouverné et contextuel aux bonnes données."

Rita Sallam, Gartner

Le futur de la donnée et de l'IA

Gartner a également un avertissement pour les entreprises qui pourraient penser qu’une approche prudente de l’IA est la meilleure stratégie. En se projetant en 2030, Gartner souligne un fossé de transformation croissant entre les leaders « AI-first » et les prudents de l’IA. 

En se concentrant uniquement sur des améliorations incrémentales de l’IA plutôt que sur une réinvention audacieuse, le risque est de passer à côté des avantages de l’IA, mais aussi d’être surpassé par ses concurrents.

Au lieu de cela, les Chief Data Officers et autres leaders de la donnée doivent comprendre où l’IA peut transformer leur façon d’opérer, à la fois en tant que fonction technique et à travers l’ensemble de l’entreprise. Par exemple, Gartner souligne qu’alors qu’en 2025, 81 % du travail informatique était effectué par des humains sans IA, d’ici 2030, ce chiffre tombera à 0 %. La gestion et l’ingénierie des données deviendront beaucoup plus une collaboration humain-agent, avec des agents d’IA adaptatifs et conscients du contexte automatisant la majorité des flux de travail d’ingénierie des données, libérant ainsi de la capacité pour un réinvestissement à plus haute valeur.

Construire une stratégie efficace pour des données prêtes pour l'IA

La montée rapide de l’IA a démontré l’importance de données de haute qualité et fiables, et la nécessité pour de nombreuses organisations de se concentrer sur la construction des bonnes fondations pour l’IA. 

Cela va au-delà de la gestion traditionnelle des données pour couvrir des domaines clés spécifiques à l’IA tels que le contexte, les data products étant ensuite rendus facilement découvrables, accessibles et disponibles pour l’IA et les humains via des data marketplaces. Ce n’est qu’alors que l’utilisation de l’IA passera à l’échelle pour offrir la performance et l’efficacité requises pour rester compétitif à l’avenir.

Dans le cadre de son engagement à soutenir les organisations dans leur parcours de produits de données, Huwise exposera au prochain Gartner Data & Analytics Summit à Londres du 11 au 13 mai. Découvrez comment nous pouvons aider à transformer votre stratégie de données en nous rendant visite sur le stand 113.

Partager cet article :

Articles sur le même thème :

Data marketplace

À propos de l’auteur

Anne-Claire Bellec

Aujourd’hui CMO d'Opendatsoft, Anne-Claire Bellec a exercé pendant 15 ans des fonctions de Chief Marketing Officer et Directrice de la communication au sein d’agences et d’entreprises SaaS spécialisées sur les enjeux data et digitaux.

Plus d'articles

Parlons [ data product marketplace ]

En 30 minutes, découvrez comment Huwise peut vous aider à créer de la valeur pour tous dans votre organisation. Réservez votre démo personnalisée avec un de nos experts et laissez-vous guider.

Demander une démo