AccueilBlogTest technique Spark
Guide recrutement data

Test technique Spark : ce qu'on evalue en entretien Data Engineer

Entre un profil qui a fait du Spark et un profil qui comprend pourquoi un job est lent, il y a un monde.

Data Builder·Juin 2025·8 min de lecture·Data Engineer
Sommaire
  1. Transformations/actions
  2. Lazy execution
  3. RDD et stages
  4. Partitionnement
  5. Optimisation
  6. Grille

Entre un profil qui "a fait du Spark" et un profil qui comprend pourquoi un job prend 4h au lieu de 20 minutes, il y a un monde.

1Transformations et actions

Question discriminante

Difference entre une transformation et une action dans Spark ?

Les transformations (filter, select, groupBy) sont paresseuses — elles construisent un plan sans rien calculer. Les actions (collect, count, write) declenchent l'execution.

2Lazy execution

Question discriminante

Pourquoi Spark utilise la lazy execution ? Quel avantage concret ?

# Ces transformations ne calculent rien df_filtered = df.filter(df.montant > 100) df_grouped = df_filtered.groupBy("region").sum("montant") # Ici seulement Spark execute et optimise le plan df_grouped.show()

3RDD, stages et tasks

Question discriminante Senior

Qu'est-ce qu'un RDD ? Comment stages et tasks s'articulent avec les shuffles ?

4Partitionnement et shuffles

Question discriminante

Une partition est 100x plus grosse que les autres. Que se passe-t-il ?

5Cluster et optimisation

Question discriminante Senior

Comment dimensionnez-vous les ressources d'un job Spark ?

6Grille par niveau

NiveauMaitrise attendueSignal GONO-GO
JuniorDataFrames, transformations/actions, ParquetExplique transformations vs actionsNe sait pas ce qu'est la lazy execution
ConfirmePartitionnement, cache, broadcast join, Spark UIA corrige un probleme de performanceN'a jamais ouvert le Spark UI
SeniorInternals, AQE, dimensionnement cluster, Delta LakeA resolu un data skew en productionNe peut pas expliquer ce qu'est un shuffle
LeadArchitecture streaming, optimisation avanceeA designe une architecture Spark StreamingNe connait pas AQE

Vous recrutez un profil data ?

Premier entretien gratuit. Rapport GO/NO-GO sous 48h.