Microsoft s’offre Osmos : l’IA pour automatiser la plomberie de la donnée dans Fabric

C’est confirmé : Microsoft vient de s’offrir Osmos, une pépite de Seattle qui promet de révolutionner la manière dont les entreprises digèrent leurs données. L’annonce, officialisée début janvier 2026, ne fait pas seulement grossir le portefeuille de Redmond ; elle envoie un signal clair à toute l’industrie. L’objectif ? Intégrer la technologie d’Osmos directement dans Microsoft Fabric pour concrétiser un vieux rêve d’ingénieur : l’ingénierie des données autonome (Autonomous Data Engineering).

La fin du cauchemar de l’ETL ?

Pour comprendre la valeur de ce rachat, il faut regarder ce qui se passe dans les sous-sols des départements IT. Avant de pouvoir analyser la moindre donnée, les entreprises doivent passer par l’étape ingrate de l’ETL (Extract, Transform, Load). C’est la « plomberie » : nettoyer des fichiers CSV mal formatés, convertir des dates, harmoniser des colonnes… Un travail manuel, fastidieux et coûteux.

C’est ici qu’intervient Osmos. Sa technologie ne se contente pas de proposer des outils pour faciliter la tâche ; elle la réalise. Grâce à une IA générative spécialisée, Osmos utilise une approche de programmation par l’exemple. L’utilisateur montre à l’IA à quoi ressemble le fichier d’entrée (souvent le chaos) et à quoi doit ressembler le fichier de sortie (propre et rangé). L’IA déduit alors les règles de transformation et génère le code nécessaire pour automatiser le flux.

Des agents IA qui codent en PySpark

L’intégration dans Microsoft Fabric va plus loin qu’un simple « assistant ». La technologie d’Osmos déploie de véritables agents autonomes :

L’AI Data Wrangler : Capable de digérer des fichiers semi-structurés ou « sales » (PDF, logs, CSV cassés) pour les transformer en tables SQL propres.
L’AI Data Engineer : Conçu pour les tâches complexes, il génère des notebooks PySpark de qualité production, incluant la gestion des erreurs et les tests.

Le point crucial pour les DSI ? Ce n’est pas une « boîte noire ». L’IA génère du code standard que les ingénieurs humains peuvent relire, auditer et modifier.

Stratégie : Supprimer la friction à l’entrée de Fabric

Pour Microsoft, ce rachat est purement stratégique. Fabric est son fer de lance pour unifier la data en entreprise. Mais une plateforme data, aussi puissante soit-elle, ne sert à rien si elle est vide. En automatisant l’ingestion des données (le fameux « first mile »), Microsoft supprime la plus grande barrière à l’adoption de son cloud.

Si l’IA d’Osmos permet de connecter une source de données complexe en 5 minutes au lieu de 5 jours, c’est autant de données qui atterrissent plus vite dans OneLake (le lac de données de Microsoft) et qui consomment plus vite de la puissance de calcul Azure. C’est une accélération mécanique du business model.

La guerre de l’infrastructure Data

Ce mouvement ne se fait pas dans le vide. Nous assistons à une course à l’armement entre les trois géants de la data moderne :

Snowflake mise sur sa simplicité et intègre l’IA via Cortex pour permettre aux analystes d’interroger leurs données en langage naturel.
Databricks reste le favori des ingénieurs purs et durs, avec une approche centrée sur le code et l’IA générative via Mosaic AI.
Microsoft tente avec Fabric et Osmos de prendre le meilleur des deux mondes : la puissance du code (PySpark) mais accessible via une interface « low-code » pilotée par l’IA.

En rachetant Osmos, Microsoft tente de verrouiller le marché en rendant la migration vers sa plateforme techniquement triviale. Pourquoi payer des ingénieurs pour maintenir des pipelines complexes sur Snowflake si l’IA de Fabric peut le faire toute seule ?

L’avis de Just Tech

L’automatisation de la « plomberie » data est une excellente nouvelle pour la productivité. Personne n’aime écrire des expressions régulières pour nettoyer des numéros de téléphone. Cependant, ce confort apporte un nouveau risque : celui de la dette technique invisible. Si l’IA génère des pipelines que personne ne prend la peine de relire, qui sera responsable le jour où une hallucination algorithmique transformera un chiffre d’affaires en perte nette ? Le métier d’ingénieur data ne va pas disparaître, mais il va muter. Il s’agira moins de « construire » les tuyaux que d’inspecter le travail des robots qui les posent. La vigilance humaine reste, pour l’instant, le meilleur pare-feu.