Azure Data Factory est l orchestrateur ETL de référence dans l écosystème Microsoft. En entretien, on évalue la capacité à concevoir des pipelines robustes et à les intégrer dans une architecture Azure.
Quels sont les 4 composants principaux d Azure Data Factory ?
Comment gérez-vous les dépendances entre activités dans ADF ? Et les erreurs ?
// Structure d un pipeline ADF typique (JSON ARM template)
{
'name': 'pipeline_ingestion_ventes',
'activities': [
{
'name': 'CopyFromSource',
'type': 'Copy',
'dependsOn': [],
'inputs': [{'referenceName': 'SourceDataset'}],
'outputs': [{'referenceName': 'StagingDataset'}]
},
{
'name': 'TransformData',
'type': 'DatabricksNotebook',
'dependsOn': [{
'activity': 'CopyFromSource',
'dependencyConditions': ['Succeeded'] // ou Failed, Skipped, Completed
}]
},
{
'name': 'OnFailure_Alert',
'type': 'WebActivity',
'dependsOn': [{
'activity': 'TransformData',
'dependencyConditions': ['Failed']
}]
}
]
}Comment évitez-vous de dupliquer vos Linked Services pour DEV/PROD ?
Quels types de triggers ADF connaissez-vous ? Dans quel cas utilisez-vous chacun ?
| Trigger | Déclenchement | Cas d usage |
|---|---|---|
| Schedule | CRON planifié | Rafraîchissement quotidien, rapports hebdomadaires |
| Tumbling Window | Fenêtres fixes, backfill possible | Traitement par tranches horaires, avec retry et dépendances |
| Event-based | Arrivée d un fichier dans Blob Storage | Ingestion déclenchée par l arrivée de fichiers partenaires |
| Manual | Déclenchement manuel ou via API REST | Tests, reprises, triggers depuis une autre application |
Quand utilisez-vous Mapping Data Flow plutôt qu une activité Databricks ?
Comment positionnez-vous ADF, Synapse et Fabric ?
| Service | Rôle | Idéal pour |
|---|---|---|
| Azure Data Factory | Orchestration ETL/ELT pure | Ingestion et mouvement de données, intégration d outils tiers |
| Azure Synapse | Analytics + intégration + Spark | SQL Analytics + pipelines Spark dans une interface unifiée |
| Microsoft Fabric | Plateforme unifiée Microsoft | Nouvelle stack end-to-end (Power BI + Synapse + ADF) sur OneLake |
Tendance 2025 : Microsoft pousse vers Fabric comme plateforme unifiée. ADF reste pertinent pour les intégrations avec des systèmes non-Microsoft.
| Niveau | Maitrise | Signal GO | NO-GO |
|---|---|---|---|
| Confirmé | Pipelines, Copy Activity, Schedule Trigger, Key Vault | A déployé un pipeline Copy + transformation, utilise Key Vault | Stocke les mots de passe en dur dans les Linked Services |
| Senior | Tumbling Window, Event Trigger, Mapping Data Flow, ARM templates | A configuré un Event Trigger, déploie via ARM/CI-CD, justifie ADF vs Databricks | Ne sait pas la différence entre Schedule et Tumbling Window |
Premier entretien gratuit. Rapport GO/NO-GO sous 48h.