AccueilBlogTest technique monitoring de la qualité des données en production
Guide recrutement data

Test technique monitoring de la qualité des données en production

La qualité des données en production se dégrade silencieusement. En entretien Senior, on évalue la capacité à mettre en place un monitoring proactif qui détecte les problèmes avant les utilisateurs.

Data Builder·Juin 2025·6 min de lecture·Data Engineer · Analytics Engineer
Sommaire
  1. Pourquoi monitorer la qualité
  2. Fraîcheur des données
  3. Monitoring des volumes
  4. Changements de schéma
  5. Outils : Elementary vs Monte Carlo
  6. Stratégie d alerting
  7. Grille

1Pourquoi le monitoring de qualité est critique

Question discriminante

Quels sont les symptômes d un problème de qualité de données non détecté ?

2Monitoring de la fraîcheur

Question discriminante

Comment alertez-vous quand une table n a pas été mise à jour dans les délais attendus ?

# dbt source freshness sources: - name: transactions tables: - name: orders loaded_at_field: updated_at freshness: warn_after: {count: 6, period: hour} error_after: {count: 24, period: hour} # Lancer la vérification dbt source freshness # Elementary (package dbt) : monitoring automatique # elementary_freshness_anomalies detecte les pics de latence models: - name: fct_orders tests: - elementary.table_anomalies: table_anomalies_type: - freshness # alerte si la table n est plus alimentee

3Monitoring des volumes

Question discriminante

Comment détectez-vous qu une table a perdu 50% de ses lignes du jour au lendemain ?

# Elementary : détection d anomalies de volume models: - name: fct_orders tests: - elementary.volume_anomalies: timestamp_column: order_date # alerte si le volume sort de la plage historique # Custom : comparer avec la moyenne glissante SELECT DATE(order_date) AS jour, COUNT(*) AS nb_commandes, AVG(COUNT(*)) OVER ( ORDER BY DATE(order_date) ROWS BETWEEN 7 PRECEDING AND 1 PRECEDING ) AS moyenne_7j, COUNT(*) / AVG(COUNT(*)) OVER ( ORDER BY DATE(order_date) ROWS BETWEEN 7 PRECEDING AND 1 PRECEDING ) AS ratio_vs_moyenne FROM fct_orders GROUP BY 1 HAVING ratio_vs_moyenne < 0.5 OR ratio_vs_moyenne > 2.0

4Détecter les changements de schéma

Question discriminante

Comment êtes-vous alerté quand une colonne est supprimée ou renommée dans une table source ?

5Elementary vs Monte Carlo vs Soda

Question discriminante

Quel outil de data observabilité choisissez-vous selon le contexte ?

OutilTypeForcesIdéal pour
ElementaryPackage dbt open sourceIntégration native dbt, gratuit, anomaly detectionÉquipes dbt-first, budget serré
Monte CarloSaaS enterpriseDétection automatique sans règles, lineage, MTTR trackingGrandes équipes, données critiques
SodaOpen source + CloudData contracts, checks SQL flexiblesChecks sur mesure, conformité
MetaplaneSaaSSimple, bonne UXÉquipes débutantes en observabilité

6Stratégie d alerting : éviter la fatigue

Question discriminante

Comment évitez-vous que les alertes de qualité soient ignorées ?

7Grille par niveau

NiveauMaitriseSignal GONO-GO
Confirmédbt source freshness, tests de volume basiquesA configuré des alertes de fraîcheur, monitore les volumesDécouvre les problèmes de qualité par les utilisateurs
SeniorAnomaly detection, Elementary ou Monte Carlo, stratégie d alertingA déployé Elementary ou Monte Carlo, a une stratégie d alerting claireNe sait pas ce qu est l anomaly detection pour la data

Vous recrutez un Data Engineer ou Analytics Engineer ?

Premier entretien gratuit. Rapport GO/NO-GO sous 48h.