Ressources recrutement data

Guides techniques data

105 guides pour évaluer les compétences réelles en entretien — SQL, dbt, Spark, architecture, ML et bien plus.

Test technique Airbyte et Fivetran : connecteurs ELT et ingestion

L ingestion est souvent le premier maillon de la stack data. En entretien, on évalue la capacité à choisir entre Fivetran et Airby…

Lire l'article →

Test technique Airflow avancé : DAGs, XCom, TaskFlow, architecture

DAGs, opérateurs, XCom, TaskFlow API, trigger rules, architecture Airflow — ce qu'on évalue vraiment dans un entretien Data Engine…

Lire l'article →

Test technique Airflow : ce qu'on evalue en entretien Data Engineer

Les 5 dimensions d'un entretien Airflow : DAGs, operateurs, dependances, production, TaskFlow API.

Lire l'article →

Test technique Apache Flink : stream processing avancé

Flink est la référence pour le stream processing à faible latence. En entretien Senior, on évalue la compréhension de l event time…

Lire l'article →

Test technique API REST pour la data : concevoir et consommer des APIs

Les APIs REST sont partout dans les pipelines data : ingestion de sources externes, exposition de features ML, interfaces avec les…

Lire l'article →

Test technique AWS stack data : S3, Glue, Athena, EMR, Redshift

AWS est le cloud dominant pour la data. En entretien, on évalue la capacité à choisir les bons services AWS selon le cas d usage e…

Lire l'article →

Test technique AWS pour la Data : ce qu'on evalue en entretien

Les 5 dimensions d'un entretien AWS data : S3, IAM, services analytics, infrastructure, couts.

Lire l'article →

Test technique Azure Data Factory : pipelines, triggers, DataFlow

Azure Data Factory est l orchestrateur ETL de référence dans l écosystème Microsoft. En entretien, on évalue la capacité à concevo…

Lire l'article →

Test technique Azure Synapse Analytics : SQL pools, Spark, intégration

Azure Synapse Analytics unifie SQL analytique et Spark dans une même plateforme. En entretien, on évalue la capacité à choisir le …

Lire l'article →

Test technique BigQuery avance : partitionnement, INFORMATION_SCHEMA, couts

BigQuery facture a la requete selon les octets lus. Un Data Engineer Senior s...

Lire l'article →

Test technique BigQuery : ce qu'on evalue en entretien

Les 5 dimensions d'un entretien BigQuery : SQL, partitionnement, couts, performance, architecture.

Lire l'article →

Test technique CI/CD Power BI : deployment pipelines et automatisation

Power BI va bien au-dela du rapport statique. En entretien Senior, on evalue la capacite a deployer de maniere reproducible, a ver…

Lire l'article →

Test technique optimisation des coûts cloud data : FinOps pour la data

Les coûts cloud data peuvent exploser sans contrôle. En entretien Senior et Lead, on évalue la capacité à architecturer pour la pe…

Lire l'article →

Test technique implémentation d un data catalog : DataHub, OpenMetadata

Déployer un data catalog est un projet qui dure 6 mois si mal planifié. En entretien, on évalue la capacité à choisir le bon outil…

Lire l'article →

Test technique Data Contracts : implémenter avec dbt et OpenAPI

Les data contracts formalisent les engagements entre producteurs et consommateurs de données. En 2025, c est un sujet d entretien …

Lire l'article →

Test technique Data Gouvernance : catalogue, lineage, qualité, RGPD

La gouvernance des données est devenue un enjeu critique. En entretien Analytics Engineer ou Data Architect, on évalue la capacité…

Lire l'article →

Test technique architecture Lakehouse : Delta, Iceberg, Hudi en production

Le Lakehouse est l architecture data dominante en 2025. En entretien Architecture ou Lead, on évalue la capacité à concevoir une a…

Lire l'article →

Test technique Data Mesh : domaines, data products, gouvernance fédérée

Domaines data, data products, self-service infrastructure, gouvernance fédérée — ce qu'on évalue pour un Data Engineer ou Data Arc…

Lire l'article →

Test technique : tester les pipelines data de bout en bout

Tester des fonctions Python est relativement simple. Tester un pipeline data complet qui orchestre Airflow, dbt et BigQuery est un…

Lire l'article →

Test technique data product management : définir et gérer des data products

Gérer une équipe data comme une équipe produit change radicalement la façon dont les projets sont priorisés et mesurés. En entreti…

Lire l'article →

Test technique monitoring de la qualité des données en production

La qualité des données en production se dégrade silencieusement. En entretien Senior, on évalue la capacité à mettre en place un m…

Lire l'article →

Test technique conception de data warehouse : modélisation avancée

Concevoir un data warehouse robuste va au-delà du schéma en étoile basique. En entretien Data Architect ou Analytics Engineer Seni…

Lire l'article →

Test technique Databricks Workflows : orchestration et MLOps

Databricks Workflows est l orchestrateur natif de Databricks. En entretien, on évalue la capacité à l utiliser efficacement pour o…

Lire l'article →

Test technique Databricks : Unity Catalog, Jobs, MLflow, Lakehouse

Databricks est la plateforme lakehouse de reference. En entretien, on evalue la maitrise de Unity Catalog pour la gouvernance, des…

Lire l'article →

Test technique Dataiku : ce qu'on evalue en entretien Data Scientist

Les 5 dimensions d'un entretien Dataiku : projets/flows, preparation, ML, MLOps, gouvernance.

Lire l'article →

DAX avancé Power BI : les formules qu'on teste en entretien

CALCULATE, REMOVEFILTERS, VAR, SWITCH, time intelligence : les formules DAX qui separent un vrai Data Analyst d'un utilisateur Pow…

Lire l'article →

Test technique dbt avance : macros, packages, snapshots, analyses

Au-dela des modeles de base, un Analytics Engineer Senior maitrise les macros, les packages communautaires, les snapshots pour le …

Lire l'article →

Test technique dbt modèles incrémentaux : stratégies et optimisation

Les modèles incrémentaux dbt sont le levier le plus puissant pour réduire les coûts et le temps de traitement. Mal configurés, ils…

Lire l'article →

Test technique dbt macros et Jinja avancé : générer du SQL dynamiquement

Les macros dbt permettent de générer du SQL dynamiquement et de créer des abstractions réutilisables. En entretien Expert, on éval…

Lire l'article →

Test technique dbt snapshots et SCD : historiser les changements

Historiser les changements de données (Slowly Changing Dimensions) est un sujet classique en entretien. dbt snapshots offrent une …

Lire l'article →

Stack dbt + Snowflake : architecture complète en production

dbt et Snowflake forment la stack analytique la plus répandue en 2025. En entretien Senior, on évalue la capacité à architecturer …

Lire l'article →

Test technique dbt testing avancé : singular tests, macros de test, coverage

Les tests dbt vont bien au-delà de not_null et unique. En entretien Senior, on évalue la capacité à écrire des tests sophistiqués …

Lire l'article →

Test technique dbt : ce qu'on evalue en entretien Analytics Engineer

Les 5 dimensions d'un entretien dbt : structure projet, tests, documentation, macros Jinja, CI/CD.

Lire l'article →

Test technique Delta Lake vs Apache Iceberg : le choix du table format

Delta Lake, Iceberg et Hudi sont les trois table formats open source qui apportent ACID au data lake. En 2025, ce choix architectu…

Lire l'article →

Test technique Docker et Docker Compose pour la data : stacks locales

Docker est le pre-requis pour tout Data Engineer moderne. En entretien, on va au-dela du simple docker run — on evalue la capacite…

Lire l'article →

Test technique Docker et Kubernetes avancé pour la data

Au-delà des bases Kubernetes, les Data Engineers déployant Airflow, Spark ou des APIs ML en production ont besoin de Helm, des Sta…

Lire l'article →

Test technique Docker : ce qu'on evalue en entretien Data Engineer

Les 5 dimensions d'un entretien Docker : images, Dockerfile, volumes, Compose, CI/CD.

Lire l'article →

Test technique DuckDB : SQL analytique in-process pour la data

DuckDB est devenu l outil de référence pour l analyse locale sur des fichiers Parquet ou des DataFrames pandas. En entretien, on é…

Lire l'article →

Test technique complet Analytics Engineer : SQL, dbt, modélisation

L Analytics Engineer est le profil le plus demandé en data en 2025. Voici le test technique complet qu on mène chez Data Builder p…

Lire l'article →

Test technique complet Data Scientist : stats, ML, production

Le Data Scientist est souvent le profil le plus difficile à évaluer correctement. Voici la structure complète d un test technique …

Lire l'article →

Test technique architecture event-driven pour la data

L architecture event-driven est devenue centrale dans les systèmes data modernes. En entretien Architect, on évalue la capacité à …

Lire l'article →

Test technique feature engineering ML : creer de bonnes features

Le feature engineering est souvent ce qui differentie un bon modele d un excellent modele. En entretien, on evalue la capacite a c…

Lire l'article →

Test technique GCP stack data : BigQuery, Dataflow, Pub/Sub, Vertex AI

Google Cloud Platform est la stack data cloud la plus cohérente. En entretien, on évalue la capacité à choisir et intégrer les bon…

Lire l'article →

Test technique Git avancé : rebase, hooks, pre-commit, gitflow

Rebase interactif, cherry-pick, pre-commit hooks, gitflow, gestion des conflits — ce qu'on évalue dans un entretien Git pour Data …

Lire l'article →

Test technique Git : ce qu'on evalue en entretien data

Les 5 dimensions d'un entretien Git : bases, branches, conflits, rebase, workflow data CI/CD.

Lire l'article →

Test technique GitHub Actions pour la data : CI/CD pipelines data

GitHub Actions est devenu le standard CI/CD pour les projets data. En entretien Senior, on evalue la capacite a automatiser le cyc…

Lire l'article →

Test technique Apache Iceberg avancé : catalog, time travel, merge-on-read

Iceberg est devenu le standard ouvert pour les tables lakehouse. En entretien Expert, on évalue la maîtrise des fonctionnalités av…

Lire l'article →

Test technique Apache Kafka : topics, partitions, consumers, Kafka Streams

Kafka est le bus de donnees de reference pour l architecture event-driven. En entretien, on evalue la capacite a concevoir des pip…

Lire l'article →

Test technique Kubernetes pour la data : pods, nodes, GKE, orchestration

Pods, nodes, cluster, GKE Autopilot vs Standard, déploiement de pipelines data — ce qu'on évalue dans un entretien Kubernetes pour…

Lire l'article →

Test technique LangChain pour les Data Engineers : agents, chains, tools

LangChain est le framework de reference pour construire des applications avec des LLMs. En entretien, on evalue la capacite a arch…

Lire l'article →

Test technique Linux / Bash : ce qu'on evalue en entretien Data Engineer

Les 5 dimensions d'un entretien Linux pour la data : navigation, fichiers, bash, environnement, processus.

Lire l'article →

Test technique Looker avancé : LookML, explores, PDTs, déploiement

Looker est l outil BI le plus technique du marché. Sa valeur vient du LookML, le langage de modélisation sémantique. En entretien,…

Lire l'article →

Test technique Looker / LookML : ce qu'on evalue en entretien

Les 5 dimensions d'un entretien Looker : explores, LookML, PDT, gouvernance, semantic layer.

Lire l'article →

Test technique ML en production : packaging, serving, monitoring

Entraîner un modèle est facile. Le maintenir en production pendant 2 ans sans régression est difficile. En entretien ML Engineer, …

Lire l'article →

Test technique BI self-service : Metabase, Streamlit, Redash

Metabase, Streamlit et Redash repondent a un besoin croissant : des dashboards rapides a deployer, sans passer par un Data Analyst…

Lire l'article →

Test technique MLflow avancé : projets, recipes, Model Registry, serving

MLflow est bien plus qu un simple outil de tracking. En entretien ML Engineer Senior, on évalue la maîtrise de MLflow Projects pou…

Lire l'article →

MLOps en pratique : REX LVMH, Dataiku, CI/CD et monitoring modeles

8 modeles sur 10 qui passent la phase pilote ne survivent pas un an en production. Ce REX concret montre pourquoi et comment le ML…

Lire l'article →

Test technique MLOps : CI/CD pour le ML, MLflow, déploiement de modèles

Feature store, MLflow, CI/CD ML, déploiement de modèles en production, monitoring de drift — ce qu'on évalue dans un entretien MLO…

Lire l'article →

Test technique NLP et embeddings : tokenisation, fine-tuning, RAG

Le NLP a été transformé par les transformers. En entretien Data Scientist, on évalue la compréhension des embeddings, la capacité …

Lire l'article →

Test technique data lineage : OpenLineage, DataHub et traçabilité

Le data lineage permet de savoir d où vient une donnée et où elle va. En 2025, c est un sujet Senior qui différencie les profils a…

Lire l'article →

Test technique pandas profiling et diagnostic qualité des données

Le diagnostic de qualité des données est systématiquement la première étape d un projet data. En entretien, on évalue la rigueur d…

Lire l'article →

Test technique Power Apps : ce qu'on évalue pour un profil data

Power Fx, canvas apps, Dataverse, Power Automate, gouvernance ALM — ce qu'on évalue vraiment dans un entretien Power Apps pour un …

Lire l'article →

Test technique Power Apps : ce qu'on evalue en entretien

Les 4 dimensions d'un entretien Power Apps : canvas apps, Power Fx, connecteurs, gouvernance.

Lire l'article →

Test technique Power BI bonnes pratiques : rapport, modèle, performance

Savoir créer un graphique dans Power BI ne suffit pas. En entretien Senior, on évalue la rigueur dans la construction du rapport :…

Lire l'article →

Power BI vs Tableau vs Looker : quel outil pour quel profil ?

Comparaison approfondie Power BI, Tableau et Looker : connectivité, modélisation, DAX vs LookML, performance, coût et gouvernance.

Lire l'article →

Test technique Power BI : ce qu'on evalue vraiment

Les 5 dimensions d'un entretien Power BI : Power Query, DAX, modelisation, deploiement, soft skills.

Lire l'article →

Test technique Prefect : orchestration moderne vs Airflow

Prefect est une alternative moderne à Airflow avec une meilleure developer experience. En entretien, on évalue la capacité à chois…

Lire l'article →

Test technique PySpark optimisation : partitions, caching, broadcast joins

Écrire du PySpark qui fonctionne est facile. Écrire du PySpark qui est rapide en production demande de maîtriser les partitions, l…

Lire l'article →

Test technique Python async pour la data : asyncio, httpx, ingestion parallèle

L async Python permet de multiplier par 10 à 100 la vitesse d ingestion d APIs. En entretien Senior, on évalue la maîtrise d async…

Lire l'article →

Test technique Python data : ce qu'on evalue en entretien

Les 5 dimensions d'un entretien Python data : bases, Pandas/DuckDB, POO, tests, APIs.

Lire l'article →

Test technique Python décorateurs pour la data : caching, retry, logging

Les décorateurs Python permettent d ajouter des comportements transversaux aux fonctions de pipeline sans les polluer. En entretie…

Lire l'article →

Test technique Python data avancé : pandas, DuckDB, Polars, optimisation

Au-delà des bases de pandas, un Data Engineer Senior maîtrise la vectorisation, la gestion mémoire, et sait quand remplacer pandas…

Lire l'article →

Test technique Python testing avancé : property-based testing, mutation testing

Les tests classiques vérifient des exemples. Le property-based testing vérifie des propriétés sur des milliers d exemples générés.

Lire l'article →

Questions comportementales en entretien data : STAR, situations difficiles

Les compétences techniques ne suffisent pas. En entretien data, les questions comportementales révèlent la maturité, la posture et…

Lire l'article →

Test technique RAG : architecture, embeddings, bases vectorielles

Le RAG est le pattern dominant pour deployer des LLMs sur des donnees internes. En entretien, on evalue la capacite a choisir la b…

Lire l'article →

Guide complet du recrutement data en 2025 : de l offre à l intégration

Recruter un Data Engineer ou Data Scientist est différent d un recrutement classique. Ce guide couvre toutes les étapes du process…

Lire l'article →

Red flags en entretien technique data : signaux d alerte pour les recruteurs

Au-dela des competences techniques, un entretien revele des signaux subtils sur la posture, la rigueur et la capacite a travailler…

Lire l'article →

Test technique régression logistique : fondations statistiques pour Data Scientist

La régression logistique est souvent le premier algorithme demandé en entretien. Mais la maîtriser vraiment — coefficients, régula…

Lire l'article →

Salaires data en France 2025 : grilles, negociation et benchmarks

Connaitre les salaires du marche est indispensable pour recruter et negocier. Voici les fourchettes constatees en 2025 en France, …

Lire l'article →

Scraping et automatisation Python avancee : Playwright, Scrapy, grande echelle

Le scraping va au-dela de BeautifulSoup sur un site statique. En entretien Data Engineer Senior, on evalue la capacite a gerer les…

Lire l'article →

Test technique web scraping Python : BeautifulSoup, Selenium, Scrapy, éthique

Le web scraping est une compétence Data Engineer courante pour collecter des données non disponibles via API. En entretien, on éva…

Lire l'article →

Test technique sécurité des données : chiffrement, accès, RGPD technique

La sécurité des données est une responsabilité du Data Engineer, pas seulement du RSSI. En entretien, on évalue la capacité à conc…

Lire l'article →

Test technique Snowflake avance : Streams, Tasks, Dynamic Tables

Snowflake n est pas juste un data warehouse SQL. En entretien Senior, on eval...

Lire l'article →

Test technique Snowflake performance : query profiling, clustering, materialized views

Au-delà des bases Snowflake, l optimisation des performances nécessite de maîtriser le Query Profile, le clustering intelligent et…

Lire l'article →

Test technique Snowflake : ce qu'on evalue en entretien

Les 5 dimensions d'un entretien Snowflake : architecture, Time Travel, Streams/Tasks, couts, gouvernance.

Lire l'article →

Test technique Spark avance : Structured Streaming, Delta Lake, optimisation

Au-dela des DataFrames de base, un Data Engineer Spark Senior maitrise le streaming, Delta Lake et l optimisation fine des jobs. C…

Lire l'article →

Test technique Spark Structured Streaming : watermarks, triggers, sinks

Spark Structured Streaming est la solution de streaming de référence dans l écosystème Spark. En entretien, on évalue la maîtrise …

Lire l'article →

Test technique Spark : ce qu'on evalue en entretien Data Engineer

Les 5 dimensions d'un entretien Spark : transformations/actions, lazy execution, RDD, partitionnement, optimisation.

Lire l'article →

Test technique SQL analytique avancé : patterns experts pour Data Analyst

Au-delà des window functions classiques, certains patterns SQL analytiques différencient vraiment les profils experts. En entretie…

Lire l'article →

Test technique SQL avance : window functions, CTEs recursives, optimisation

Tout le monde sait faire un SELECT avec JOIN. Ce qu on evalue en entretien Senior, c est la maitrise des window functions, l ecrit…

Lire l'article →

Test technique SQL : ce qu'on evalue vraiment en entretien data

Les 5 dimensions d'un entretien SQL : jointures, agregations, window functions, optimisation, modelisation.

Lire l'article →

Stack data moderne 2025 : quelle architecture choisir ?

Modern Data Stack, Lakehouse, Data Mesh — le marché propose de nombreuses architectures. En entretien Lead ou Architect, on évalue…

Lire l'article →

Comment structurer un entretien technique data : guide recruteur

Un entretien mal structuré évalue les candidats de manière incohérente et rate les bons profils. Voici comment structurer un entre…

Lire l'article →

Test technique données synthétiques : générer des données de test réalistes

Les données synthétiques permettent de tester les pipelines et entraîner des modèles sans exposer de données réelles. En entretien…

Lire l'article →

Test technique Tableau avancé : LOD, calculs de table, Tableau Prep

LOD expressions, calculs de table, Tableau Prep, dashboards dynamiques et gouvernance — ce qu'on évalue vraiment dans un entretien…

Lire l'article →

Test technique Tableau Server Client : automatisation Python de Tableau Cloud

Tableau Server Client (TSC) est la bibliotheque Python officielle pour automatiser l administration de Tableau Server ou Tableau C…

Lire l'article →

Test technique Tableau : ce qu'on evalue en entretien Data Analyst

Les 5 dimensions d'un entretien Tableau : vues, calculs, LOD expressions, Tableau Prep, performance.

Lire l'article →

Test technique Terraform pour la data : IaC, modules, state, CI/CD

Terraform est devenu incontournable pour les Data Engineers qui provisionnent des ressources cloud. En entretien, on evalue la cap…

Lire l'article →

Test technique A/B testing rigoureux : statistiques pour les décisions data

Les A/B tests mal conduits mènent à de mauvaises décisions business. En entretien Senior, on évalue la rigueur statistique : puiss…

Lire l'article →

Test technique : tester ses pipelines data avec pytest

Un pipeline data sans tests est une bombe à retardement. En entretien Senior, on évalue la capacité à écrire des tests automatisés…

Lire l'article →

Test technique séries temporelles : analyse, prédiction, anomaly detection

Les données temporelles ont des propriétés spécifiques (autocorrélation, saisonnalité, trend) qui nécessitent des méthodes dédiées…

Lire l'article →

Test technique Trino : SQL fédéré sur sources multiples

Trino (ex-Presto) est le moteur SQL de référence pour interroger plusieurs sources de données depuis une seule requête. En entreti…

Lire l'article →

Test technique UX design pour dashboards : discovery, wireframes, bonnes pratiques

Discovery utilisateur, Double Diamond, wireframes, choix des visuels, hiérarchie d'information — ce qu'on évalue dans un entretien…

Lire l'article →

Test technique Web Analytics : GA4, Tag Management, server-side tracking

Le web analytics est un metier a part dans la data. GA4 et le tracking server-side ont transforme les pratiques depuis 2023. En en…

Lire l'article →

Test technique XGBoost et Random Forest : entretien Data Scientist

XGBoost et Random Forest sont les algorithmes les plus utilisés en data science tabulaire. En entretien, on va au-delà de l usage …

Lire l'article →