AccueilBlogTest technique BigQuery
Guide recrutement data

Test technique BigQuery : ce qu'on evalue en entretien

BigQuery est puissant — et couteux si mal utilise. Un SELECT * sur 10 TB peut couter 50 euros en un clic.

Data Builder·Juin 2025·7 min de lecture·Data Engineer · Analytics Engineer

BigQuery est puissant — et couteux si mal utilise. Un SELECT * sur une table de 10 TB peut couter 50 euros en un clic.

1SQL BigQuery : specificites

Question discriminante

Differences principales entre le SQL BigQuery et un SQL standard ?

-- QUALIFY : alternative elegante aux sous-requetes SELECT user_id, event_date FROM events QUALIFY ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY event_date DESC) = 1
  • QUALIFY — filtrer sur window functions sans sous-requete
  • STRUCT et ARRAY — types imbriques tres courants dans BQ
  • UNNEST — aplatir les arrays en lignes

2Partitionnement et clustering

Question discriminante

Difference entre partitionnement et clustering ? Quand utiliser l'un ou l'autre ?

Le partitionnement divise la table en segments (souvent par date). Le clustering trie les donnees dans chaque partition. Les deux sont complementaires.

  • Partition pruning — le filtre doit porter sur la colonne de partition
  • Partition expiration — supprimer automatiquement les donnees anciennes

3Gestion des couts

Question discriminante

Comment optimisez-vous les couts sur BigQuery ? Trois pratiques concretes.

  • Eviter SELECT * — le cout est proportionnel aux bytes scannes
  • Materialized views — pre-calculer les requetes frequentes
  • Cost controls — quotas par projet ou utilisateur

Signal d'alerte : SELECT * sur une grande table non partitionnee est eliminatoire pour un profil Senior.

4Performance

Question discriminante Senior

Une requete scanne 10 TB et prend 5 minutes. Comment l'analysez-vous ?

  • Query plan et execution details dans la console BQ
  • Bytes processed — indicateur principal
  • Broadcast des petites tables

5Architecture et ecosystem

  • BigQuery ML — modeles ML directement en SQL
  • BigQuery Omni — requeter des donnees sur AWS ou Azure
  • Tables externes sur Google Cloud Storage

6Grille par niveau

NiveauMaitrise attendueSignal GONO-GO
JuniorSQL BQ de base, lecture/ecriture de tablesConnait QUALIFY, evite SELECT *Ne sait pas ce qu'est le partitionnement
ConfirmePartitionnement, clustering, STRUCT/ARRAY, coutsA partitionne une table, connait les bytes scannesNe sait pas pourquoi SELECT * est couteux
SeniorMaterialized views, BI Engine, query planA optimise une requete de 10x moins de bytesN'a jamais lu un query plan BQ
LeadArchitecture data lakehouse, gouvernanceA defini la strategie de partitionnement organisationNe connait pas BigQuery Omni

Vous recrutez un profil data ?

Premier entretien gratuit. Rapport GO/NO-GO sous 48h.

Tester gratuitementReserver un appel