AccueilBlogMLOps en pratique : REX LVMH, Dataiku, CI/CD et monitoring modeles
Guide recrutement data

MLOps en pratique : REX LVMH, Dataiku, CI/CD et monitoring modeles

8 modeles sur 10 qui passent la phase pilote ne survivent pas un an en production. Ce REX concret montre pourquoi et comment le MLOps resout ces problemes avec Dataiku dans un contexte grand groupe.

Data Builder·Juin 2025·7 min de lecture·Data Scientist · ML Engineer
Sommaire
  1. Le probleme MLOps en production
  2. Cycle de vie d un modele
  3. Le framework CI/CD ML
  4. MLOps avec Dataiku
  5. Fiabilite, scalabilite, tracabilite
  6. Portfolio LVMH
  7. Grille

Dans un grand groupe comme LVMH, maintenir des modeles ML en production sur des dizaines de maisons est un defi d organisation autant que de technique. Ce guide part d un cas concret.

1Le probleme : 8/10 modeles n survivent pas un an

Question discriminante

Pourquoi la majorite des modeles ML deployés ne survivent-ils pas un an en production ? Quelles sont les causes racines ?

2Les 4 phases du cycle de vie MLOps

PhaseActiviteOutput
1. IdentificationDefinition claire du probleme metierBusiness case valide, KPIs definis
2. DeveloppementCreation et entrainement du modele MLModele valide sur dataset de test
3. Phase piloteTest en conditions reelles, validation de la performanceValidation metier, seuils de performance etablis
4. ProductionIntegration, monitoring continu, ameliorationModele monitore, reentraine si derive detectee

3Le framework CI/CD ML : fiabilite, scalabilite, tracabilite

Question discriminante

Qu entendez-vous par CI/CD pour le ML ? En quoi est-ce different du CI/CD software classique ?

4MLOps avec Dataiku : ce que la plateforme apporte

Architecture MLOps LVMH avec Dataiku : [Donnees] -> [Scenario Dataiku] | Orchestration automatique : - Trigger : temporel, changement dataset, manuel - Reporter : Teams, email sur succes/echec | Metrics & checks (30% du temps) : - Data quality (schema, distributions) - Model performance en validation - Model performance en production - Distribution des outputs (avant/apres post-processing) | Refactoring code (60% du temps) : - Visual recipes -> SQL -> Python (performance) - SQL Pipelines (traitement natif en base) - Optimisation du stockage (zones) | Visualisation (5%) : - Dashboard de suivi dans Dataiku

560% du temps : le refactoring est roi

Question discriminante

Dans un projet MLOps, combien de temps passez-vous a la modelisation vs au pipeline et au refactoring ?

6Types de modeles en production chez LVMH

7Grille par niveau

NiveauMaitriseSignal GONO-GO
ConfirmeA deploye un modele, connait MLflow, fait des checks basiquesA deploye en production, surveille la performance, reconnait les causes d obsolescencePense que deployer = mettre le notebook en prod
SeniorFramework MLOps complet, monitoring derive, CI/CD ML, Dataiku ou MLflow avanceA mis en place un monitoring complet, a configure un retraining automatiqueN a pas de monitoring sur ses modeles en production
LeadArchitecture MLOps organisation, gouvernance des modeles, choix de plateformesA defini le framework MLOps de son organisation, a choisi et deploye la plateformeNe peut pas expliquer pourquoi ses modeles meurent en production

Vous recrutez un Data Scientist ou ML Engineer ?

Premier entretien gratuit. Rapport GO/NO-GO sous 48h.