BigQuery est puissant — et couteux si mal utilise. Un SELECT * sur 10 TB peut couter 50 euros en un clic.
BigQuery est puissant — et couteux si mal utilise. Un SELECT * sur une table de 10 TB peut couter 50 euros en un clic.
Differences principales entre le SQL BigQuery et un SQL standard ?
-- QUALIFY : alternative elegante aux sous-requetes
SELECT user_id, event_date
FROM events
QUALIFY ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY event_date DESC) = 1Difference entre partitionnement et clustering ? Quand utiliser l'un ou l'autre ?
Le partitionnement divise la table en segments (souvent par date). Le clustering trie les donnees dans chaque partition. Les deux sont complementaires.
Comment optimisez-vous les couts sur BigQuery ? Trois pratiques concretes.
Signal d'alerte : SELECT * sur une grande table non partitionnee est eliminatoire pour un profil Senior.
Une requete scanne 10 TB et prend 5 minutes. Comment l'analysez-vous ?
| Niveau | Maitrise attendue | Signal GO | NO-GO |
|---|---|---|---|
| Junior | SQL BQ de base, lecture/ecriture de tables | Connait QUALIFY, evite SELECT * | Ne sait pas ce qu'est le partitionnement |
| Confirme | Partitionnement, clustering, STRUCT/ARRAY, couts | A partitionne une table, connait les bytes scannes | Ne sait pas pourquoi SELECT * est couteux |
| Senior | Materialized views, BI Engine, query plan | A optimise une requete de 10x moins de bytes | N'a jamais lu un query plan BQ |
| Lead | Architecture data lakehouse, gouvernance | A defini la strategie de partitionnement organisation | Ne connait pas BigQuery Omni |
Premier entretien gratuit. Rapport GO/NO-GO sous 48h.