AWS est le cloud dominant en data engineering. Entre creer un bucket S3 et concevoir une architecture data lakehouse, l'ecart est considerable.
AWS est le cloud dominant en data engineering. "Utiliser AWS" peut signifier avoir cree un bucket S3 ou avoir concu une architecture data lakehouse complete.
Decrivez les principales options de stockage pour un pipeline data sur AWS.
Comment gerez-vous les acces aux donnees sensibles dans un pipeline AWS ?
Signal d'alerte : un profil qui stocke des credentials AWS dans le code ou des fichiers versiones est eliminatoire.
Pour un pipeline ELT (ingest -> transform -> expose), quels services AWS choisissez-vous ?
Comment deploieriez-vous un pipeline Airflow sur AWS ?
Votre facture AWS a double ce mois. Par quoi commencez-vous ?
| Niveau | Maitrise attendue | Signal GO | NO-GO |
|---|---|---|---|
| Junior | S3 basique, IAM concepts, Athena, Lambda | Comprend les storage classes, utilise les roles IAM | Stocke des credentials dans le code |
| Confirme | Glue, Redshift, Kinesis, VPC basique | A concu un pipeline ELT sur AWS, utilise Secrets Manager | Ne connait pas la difference EMR vs Glue |
| Senior | Architecture data lakehouse, IaC, MWAA, couts | A deploye une architecture complete avec Terraform | Ne sait pas diagnostiquer une facture anormale |
| Lead | Architecture multi-comptes, gouvernance, Landing Zone | A mis en place une AWS Landing Zone data | Ne peut pas expliquer MWAA vs ECS |
Premier entretien gratuit. Rapport GO/NO-GO sous 48h.