AccueilBlogTest technique AWS pour la Data
Guide recrutement data

Test technique AWS pour la Data : ce qu'on evalue en entretien

AWS est le cloud dominant en data engineering. Entre creer un bucket S3 et concevoir une architecture data lakehouse, l'ecart est considerable.

Data Builder·Juin 2025·8 min de lecture·Data Engineer

AWS est le cloud dominant en data engineering. "Utiliser AWS" peut signifier avoir cree un bucket S3 ou avoir concu une architecture data lakehouse complete.

1S3 et stockage

Question discriminante

Decrivez les principales options de stockage pour un pipeline data sur AWS.

  • S3 — stockage objet central de tout data lake AWS
  • S3 storage classes : Standard, Infrequent Access, Glacier — optimisation couts
  • Partitionnement S3 — organisation des prefixes pour Athena/Glue
  • Formats : Parquet, Delta Lake, Iceberg sur S3

2IAM et securite

Question discriminante

Comment gerez-vous les acces aux donnees sensibles dans un pipeline AWS ?

  • IAM roles vs users — toujours preferer les roles
  • Principe du moindre privilege
  • AWS Secrets Manager — rotation automatique des secrets
  • KMS — chiffrement des donnees au repos

Signal d'alerte : un profil qui stocke des credentials AWS dans le code ou des fichiers versiones est eliminatoire.

3Services analytics

Question discriminante

Pour un pipeline ELT (ingest -> transform -> expose), quels services AWS choisissez-vous ?

  • Glue — ETL serverless + Glue Data Catalog
  • Athena — SQL interactif sur S3 (pay-per-query)
  • Redshift — data warehouse pour les gros volumes analytiques
  • EMR — clusters Spark manages
  • Kinesis — ingestion de donnees en streaming
  • Step Functions — orchestration de workflows serverless

4Infrastructure data

Question discriminante

Comment deploieriez-vous un pipeline Airflow sur AWS ?

  • MWAA — Airflow manage par AWS
  • ECS / EKS — containers manages
  • Infrastructure as Code : Terraform ou CDK
  • VPC et subnets — isolation reseau des composants data

5Couts et optimisation

Question discriminante

Votre facture AWS a double ce mois. Par quoi commencez-vous ?

  • AWS Cost Explorer — analyser les couts par service et par tag
  • Spot instances — reduire les couts EMR de 70-90%
  • S3 Intelligent-Tiering — optimisation automatique des classes

6Grille par niveau

NiveauMaitrise attendueSignal GONO-GO
JuniorS3 basique, IAM concepts, Athena, LambdaComprend les storage classes, utilise les roles IAMStocke des credentials dans le code
ConfirmeGlue, Redshift, Kinesis, VPC basiqueA concu un pipeline ELT sur AWS, utilise Secrets ManagerNe connait pas la difference EMR vs Glue
SeniorArchitecture data lakehouse, IaC, MWAA, coutsA deploye une architecture complete avec TerraformNe sait pas diagnostiquer une facture anormale
LeadArchitecture multi-comptes, gouvernance, Landing ZoneA mis en place une AWS Landing Zone dataNe peut pas expliquer MWAA vs ECS

Vous recrutez un profil data ?

Premier entretien gratuit. Rapport GO/NO-GO sous 48h.

Tester gratuitementReserver un appel