Airflow orchestre des milliers de pipelines data. Concevoir un DAG robuste n'est pas la meme chose que lire un DAG existant.
Airflow orchestre des milliers de pipelines data en production. Concevoir un DAG robuste n'est pas la meme chose que lire un DAG existant.
Qu'est-ce qu'un DAG dans Airflow ? Pourquoi doit-il etre acyclique ?
with DAG(dag_id="pipeline", schedule="0 6 * * *",
start_date=datetime(2025,1,1), catchup=False) as dag:
task_a >> task_b >> [task_c, task_d] >> task_eDifference entre un operateur et un hook ?
Comment une tache attend-elle la completion d'un DAG externe ?
Un DAG critique echoue a 3h du matin. Qu'avez-vous mis en place ?
Qu'est-ce que la TaskFlow API ? En quoi simplifie-t-elle les DAGs ?
| Niveau | Maitrise attendue | Signal GO | NO-GO |
|---|---|---|---|
| Junior | Lire un DAG, PythonOperator, scheduling cron | Comprend catchup et backfill | Confond DAG et task |
| Confirme | Sensors, XComs, Variables, retry, providers | A configure des alertes, ExternalTaskSensor | N'a jamais configure de retry |
| Senior | TaskFlow API, dynamic tasks, SLAs, monitoring | Monitoring complet en prod, SLAs configures | Ne connait pas la TaskFlow API |
| Lead | Architecture multi-DAGs, dataset scheduling | A defini les standards de DAGs equipe | Ne peut pas expliquer les compromis de couplage |
Premier entretien gratuit. Rapport GO/NO-GO sous 48h.