AccueilBlogTest technique Azure Synapse Analytics : SQL pools, Spark, intégration
Guide recrutement data

Test technique Azure Synapse Analytics : SQL pools, Spark, intégration

Azure Synapse Analytics unifie SQL analytique et Spark dans une même plateforme. En entretien, on évalue la capacité à choisir le bon pool selon le cas d usage.

Data Builder·Juin 2025·6 min de lecture·Data Engineer
Sommaire
  1. Architecture Synapse
  2. Dedicated SQL Pool
  3. Serverless SQL Pool
  4. Spark Pool
  5. Intégration Azure Data Lake
  6. Synapse vs Databricks vs Fabric
  7. Grille

1Architecture Synapse : les 3 moteurs

Question discriminante

Quels sont les 3 moteurs de calcul dans Azure Synapse ? Quand utilisez-vous chacun ?

2Dedicated SQL Pool : MPP pour le BI

Question discriminante

Comment optimisez-vous les performances d un Dedicated SQL Pool ?

-- Distribution des tables : clé de performance critique -- HASH : distribuer selon une colonne de jointure fréquente CREATE TABLE fct_orders WITH ( DISTRIBUTION = HASH(customer_id), -- évite le data shuffle sur les jointures CLUSTERED COLUMNSTORE INDEX -- optimal pour les requêtes analytiques ) AS SELECT * FROM source_table; -- ROUND_ROBIN : pour les tables de staging CREATE TABLE stg_orders_raw WITH (DISTRIBUTION = ROUND_ROBIN) AS SELECT * FROM ... -- Statistics : mettre à jour après chargement UPDATE STATISTICS fct_orders; -- Pause automatique (économie de coûts) ALTER DATABASE mydw PAUSE; -- via PowerShell ou ADF

3Serverless SQL Pool : requêter le Data Lake

Question discriminante

Comment requêtez-vous des fichiers Parquet dans ADLS avec le Serverless SQL Pool ?

-- Requête directe sur des fichiers Parquet dans ADLS SELECT year, region, SUM(amount) as revenue FROM OPENROWSET( BULK 'https://monstorage.dfs.core.windows.net/datalake/orders/**', FORMAT = 'PARQUET' ) AS orders WHERE year = 2024 GROUP BY year, region; -- Créer une vue externe (évite de répéter OPENROWSET) CREATE OR ALTER VIEW vw_orders AS SELECT * FROM OPENROWSET( BULK 'https://monstorage.dfs.core.windows.net/datalake/orders/**', FORMAT = 'PARQUET' ) AS r; -- Requête sur Delta Lake SELECT TOP 100 * FROM OPENROWSET( BULK 'https://monstorage.dfs.core.windows.net/datalake/delta/orders', FORMAT = 'DELTA' ) AS delta_orders;

4Spark Pool : transformations et ML

Question discriminante

Dans quel cas utilisez-vous le Spark Pool plutôt que le SQL Pool dans Synapse ?

5Intégration Azure Data Lake Storage Gen2

Question discriminante

Comment organisez-vous votre Data Lake dans ADLS pour une utilisation avec Synapse ?

6Synapse vs Databricks vs Microsoft Fabric

Question discriminante

Comment positionnez-vous Synapse, Databricks et Fabric ?

Azure SynapseDatabricksMicrosoft Fabric
SQL analytiqueExcellent (MPP natif)Bon (SQL Warehouse)Excellent (OneLake)
SparkBonExcellent (optimisé)Bon
ML/AIPartielExcellent (MLflow natif)Partiel
Intégration MicrosoftNatifBonneNatif (Power BI)
Tendance 2025Mature, remplacé par FabricStandard ML enterpriseNouveau, stratégie Microsoft

7Grille par niveau

NiveauMaitriseSignal GONO-GO
ConfirméServerless SQL Pool, Dedicated Pool basique, ADLSA requêté des Parquet avec OPENROWSET, comprend les 3 poolsNe sait pas la différence entre Serverless et Dedicated
SeniorDistribution HASH, Spark Pool, Delta Lake, comparaison Synapse/DatabricksA optimisé un Dedicated Pool (distribution, statistics), justifie Synapse vs DatabricksNe sait pas ce qu est la distribution HASH

Vous recrutez un Data Engineer Azure ?

Premier entretien gratuit. Rapport GO/NO-GO sous 48h.