La qualité des données en production se dégrade silencieusement. En entretien Senior, on évalue la capacité à mettre en place un monitoring proactif qui détecte les problèmes avant les utilisateurs.
Quels sont les symptômes d un problème de qualité de données non détecté ?
Comment alertez-vous quand une table n a pas été mise à jour dans les délais attendus ?
# dbt source freshness
sources:
- name: transactions
tables:
- name: orders
loaded_at_field: updated_at
freshness:
warn_after: {count: 6, period: hour}
error_after: {count: 24, period: hour}
# Lancer la vérification
dbt source freshness
# Elementary (package dbt) : monitoring automatique
# elementary_freshness_anomalies detecte les pics de latence
models:
- name: fct_orders
tests:
- elementary.table_anomalies:
table_anomalies_type:
- freshness # alerte si la table n est plus alimenteeComment détectez-vous qu une table a perdu 50% de ses lignes du jour au lendemain ?
# Elementary : détection d anomalies de volume
models:
- name: fct_orders
tests:
- elementary.volume_anomalies:
timestamp_column: order_date
# alerte si le volume sort de la plage historique
# Custom : comparer avec la moyenne glissante
SELECT
DATE(order_date) AS jour,
COUNT(*) AS nb_commandes,
AVG(COUNT(*)) OVER (
ORDER BY DATE(order_date)
ROWS BETWEEN 7 PRECEDING AND 1 PRECEDING
) AS moyenne_7j,
COUNT(*) / AVG(COUNT(*)) OVER (
ORDER BY DATE(order_date)
ROWS BETWEEN 7 PRECEDING AND 1 PRECEDING
) AS ratio_vs_moyenne
FROM fct_orders
GROUP BY 1
HAVING ratio_vs_moyenne < 0.5 OR ratio_vs_moyenne > 2.0Comment êtes-vous alerté quand une colonne est supprimée ou renommée dans une table source ?
Quel outil de data observabilité choisissez-vous selon le contexte ?
| Outil | Type | Forces | Idéal pour |
|---|---|---|---|
| Elementary | Package dbt open source | Intégration native dbt, gratuit, anomaly detection | Équipes dbt-first, budget serré |
| Monte Carlo | SaaS enterprise | Détection automatique sans règles, lineage, MTTR tracking | Grandes équipes, données critiques |
| Soda | Open source + Cloud | Data contracts, checks SQL flexibles | Checks sur mesure, conformité |
| Metaplane | SaaS | Simple, bonne UX | Équipes débutantes en observabilité |
Comment évitez-vous que les alertes de qualité soient ignorées ?
| Niveau | Maitrise | Signal GO | NO-GO |
|---|---|---|---|
| Confirmé | dbt source freshness, tests de volume basiques | A configuré des alertes de fraîcheur, monitore les volumes | Découvre les problèmes de qualité par les utilisateurs |
| Senior | Anomaly detection, Elementary ou Monte Carlo, stratégie d alerting | A déployé Elementary ou Monte Carlo, a une stratégie d alerting claire | Ne sait pas ce qu est l anomaly detection pour la data |
Premier entretien gratuit. Rapport GO/NO-GO sous 48h.