105 guides pour évaluer les compétences réelles en entretien — SQL, dbt, Spark, architecture, ML et bien plus.
L ingestion est souvent le premier maillon de la stack data. En entretien, on évalue la capacité à choisir entre Fivetran et Airby…
Lire l'article →DAGs, opérateurs, XCom, TaskFlow API, trigger rules, architecture Airflow — ce qu'on évalue vraiment dans un entretien Data Engine…
Lire l'article →Les 5 dimensions d'un entretien Airflow : DAGs, operateurs, dependances, production, TaskFlow API.
Lire l'article →Flink est la référence pour le stream processing à faible latence. En entretien Senior, on évalue la compréhension de l event time…
Lire l'article →Les APIs REST sont partout dans les pipelines data : ingestion de sources externes, exposition de features ML, interfaces avec les…
Lire l'article →AWS est le cloud dominant pour la data. En entretien, on évalue la capacité à choisir les bons services AWS selon le cas d usage e…
Lire l'article →Les 5 dimensions d'un entretien AWS data : S3, IAM, services analytics, infrastructure, couts.
Lire l'article →Azure Data Factory est l orchestrateur ETL de référence dans l écosystème Microsoft. En entretien, on évalue la capacité à concevo…
Lire l'article →Azure Synapse Analytics unifie SQL analytique et Spark dans une même plateforme. En entretien, on évalue la capacité à choisir le …
Lire l'article →BigQuery facture a la requete selon les octets lus. Un Data Engineer Senior s...
Lire l'article →Les 5 dimensions d'un entretien BigQuery : SQL, partitionnement, couts, performance, architecture.
Lire l'article →Power BI va bien au-dela du rapport statique. En entretien Senior, on evalue la capacite a deployer de maniere reproducible, a ver…
Lire l'article →Les coûts cloud data peuvent exploser sans contrôle. En entretien Senior et Lead, on évalue la capacité à architecturer pour la pe…
Lire l'article →Déployer un data catalog est un projet qui dure 6 mois si mal planifié. En entretien, on évalue la capacité à choisir le bon outil…
Lire l'article →Les data contracts formalisent les engagements entre producteurs et consommateurs de données. En 2025, c est un sujet d entretien …
Lire l'article →La gouvernance des données est devenue un enjeu critique. En entretien Analytics Engineer ou Data Architect, on évalue la capacité…
Lire l'article →Le Lakehouse est l architecture data dominante en 2025. En entretien Architecture ou Lead, on évalue la capacité à concevoir une a…
Lire l'article →Domaines data, data products, self-service infrastructure, gouvernance fédérée — ce qu'on évalue pour un Data Engineer ou Data Arc…
Lire l'article →Tester des fonctions Python est relativement simple. Tester un pipeline data complet qui orchestre Airflow, dbt et BigQuery est un…
Lire l'article →Gérer une équipe data comme une équipe produit change radicalement la façon dont les projets sont priorisés et mesurés. En entreti…
Lire l'article →La qualité des données en production se dégrade silencieusement. En entretien Senior, on évalue la capacité à mettre en place un m…
Lire l'article →Concevoir un data warehouse robuste va au-delà du schéma en étoile basique. En entretien Data Architect ou Analytics Engineer Seni…
Lire l'article →Databricks Workflows est l orchestrateur natif de Databricks. En entretien, on évalue la capacité à l utiliser efficacement pour o…
Lire l'article →Databricks est la plateforme lakehouse de reference. En entretien, on evalue la maitrise de Unity Catalog pour la gouvernance, des…
Lire l'article →Les 5 dimensions d'un entretien Dataiku : projets/flows, preparation, ML, MLOps, gouvernance.
Lire l'article →CALCULATE, REMOVEFILTERS, VAR, SWITCH, time intelligence : les formules DAX qui separent un vrai Data Analyst d'un utilisateur Pow…
Lire l'article →Au-dela des modeles de base, un Analytics Engineer Senior maitrise les macros, les packages communautaires, les snapshots pour le …
Lire l'article →Les modèles incrémentaux dbt sont le levier le plus puissant pour réduire les coûts et le temps de traitement. Mal configurés, ils…
Lire l'article →Les macros dbt permettent de générer du SQL dynamiquement et de créer des abstractions réutilisables. En entretien Expert, on éval…
Lire l'article →Historiser les changements de données (Slowly Changing Dimensions) est un sujet classique en entretien. dbt snapshots offrent une …
Lire l'article →dbt et Snowflake forment la stack analytique la plus répandue en 2025. En entretien Senior, on évalue la capacité à architecturer …
Lire l'article →Les tests dbt vont bien au-delà de not_null et unique. En entretien Senior, on évalue la capacité à écrire des tests sophistiqués …
Lire l'article →Les 5 dimensions d'un entretien dbt : structure projet, tests, documentation, macros Jinja, CI/CD.
Lire l'article →Delta Lake, Iceberg et Hudi sont les trois table formats open source qui apportent ACID au data lake. En 2025, ce choix architectu…
Lire l'article →Docker est le pre-requis pour tout Data Engineer moderne. En entretien, on va au-dela du simple docker run — on evalue la capacite…
Lire l'article →Au-delà des bases Kubernetes, les Data Engineers déployant Airflow, Spark ou des APIs ML en production ont besoin de Helm, des Sta…
Lire l'article →Les 5 dimensions d'un entretien Docker : images, Dockerfile, volumes, Compose, CI/CD.
Lire l'article →DuckDB est devenu l outil de référence pour l analyse locale sur des fichiers Parquet ou des DataFrames pandas. En entretien, on é…
Lire l'article →L Analytics Engineer est le profil le plus demandé en data en 2025. Voici le test technique complet qu on mène chez Data Builder p…
Lire l'article →Le Data Scientist est souvent le profil le plus difficile à évaluer correctement. Voici la structure complète d un test technique …
Lire l'article →L architecture event-driven est devenue centrale dans les systèmes data modernes. En entretien Architect, on évalue la capacité à …
Lire l'article →Le feature engineering est souvent ce qui differentie un bon modele d un excellent modele. En entretien, on evalue la capacite a c…
Lire l'article →Google Cloud Platform est la stack data cloud la plus cohérente. En entretien, on évalue la capacité à choisir et intégrer les bon…
Lire l'article →Rebase interactif, cherry-pick, pre-commit hooks, gitflow, gestion des conflits — ce qu'on évalue dans un entretien Git pour Data …
Lire l'article →Les 5 dimensions d'un entretien Git : bases, branches, conflits, rebase, workflow data CI/CD.
Lire l'article →GitHub Actions est devenu le standard CI/CD pour les projets data. En entretien Senior, on evalue la capacite a automatiser le cyc…
Lire l'article →Iceberg est devenu le standard ouvert pour les tables lakehouse. En entretien Expert, on évalue la maîtrise des fonctionnalités av…
Lire l'article →Kafka est le bus de donnees de reference pour l architecture event-driven. En entretien, on evalue la capacite a concevoir des pip…
Lire l'article →Pods, nodes, cluster, GKE Autopilot vs Standard, déploiement de pipelines data — ce qu'on évalue dans un entretien Kubernetes pour…
Lire l'article →LangChain est le framework de reference pour construire des applications avec des LLMs. En entretien, on evalue la capacite a arch…
Lire l'article →Les 5 dimensions d'un entretien Linux pour la data : navigation, fichiers, bash, environnement, processus.
Lire l'article →Looker est l outil BI le plus technique du marché. Sa valeur vient du LookML, le langage de modélisation sémantique. En entretien,…
Lire l'article →Les 5 dimensions d'un entretien Looker : explores, LookML, PDT, gouvernance, semantic layer.
Lire l'article →Entraîner un modèle est facile. Le maintenir en production pendant 2 ans sans régression est difficile. En entretien ML Engineer, …
Lire l'article →Metabase, Streamlit et Redash repondent a un besoin croissant : des dashboards rapides a deployer, sans passer par un Data Analyst…
Lire l'article →MLflow est bien plus qu un simple outil de tracking. En entretien ML Engineer Senior, on évalue la maîtrise de MLflow Projects pou…
Lire l'article →8 modeles sur 10 qui passent la phase pilote ne survivent pas un an en production. Ce REX concret montre pourquoi et comment le ML…
Lire l'article →Feature store, MLflow, CI/CD ML, déploiement de modèles en production, monitoring de drift — ce qu'on évalue dans un entretien MLO…
Lire l'article →Le NLP a été transformé par les transformers. En entretien Data Scientist, on évalue la compréhension des embeddings, la capacité …
Lire l'article →Le data lineage permet de savoir d où vient une donnée et où elle va. En 2025, c est un sujet Senior qui différencie les profils a…
Lire l'article →Le diagnostic de qualité des données est systématiquement la première étape d un projet data. En entretien, on évalue la rigueur d…
Lire l'article →Power Fx, canvas apps, Dataverse, Power Automate, gouvernance ALM — ce qu'on évalue vraiment dans un entretien Power Apps pour un …
Lire l'article →Les 4 dimensions d'un entretien Power Apps : canvas apps, Power Fx, connecteurs, gouvernance.
Lire l'article →Savoir créer un graphique dans Power BI ne suffit pas. En entretien Senior, on évalue la rigueur dans la construction du rapport :…
Lire l'article →Comparaison approfondie Power BI, Tableau et Looker : connectivité, modélisation, DAX vs LookML, performance, coût et gouvernance.
Lire l'article →Les 5 dimensions d'un entretien Power BI : Power Query, DAX, modelisation, deploiement, soft skills.
Lire l'article →Prefect est une alternative moderne à Airflow avec une meilleure developer experience. En entretien, on évalue la capacité à chois…
Lire l'article →Écrire du PySpark qui fonctionne est facile. Écrire du PySpark qui est rapide en production demande de maîtriser les partitions, l…
Lire l'article →L async Python permet de multiplier par 10 à 100 la vitesse d ingestion d APIs. En entretien Senior, on évalue la maîtrise d async…
Lire l'article →Les 5 dimensions d'un entretien Python data : bases, Pandas/DuckDB, POO, tests, APIs.
Lire l'article →Les décorateurs Python permettent d ajouter des comportements transversaux aux fonctions de pipeline sans les polluer. En entretie…
Lire l'article →Au-delà des bases de pandas, un Data Engineer Senior maîtrise la vectorisation, la gestion mémoire, et sait quand remplacer pandas…
Lire l'article →Les tests classiques vérifient des exemples. Le property-based testing vérifie des propriétés sur des milliers d exemples générés.
Lire l'article →Les compétences techniques ne suffisent pas. En entretien data, les questions comportementales révèlent la maturité, la posture et…
Lire l'article →Le RAG est le pattern dominant pour deployer des LLMs sur des donnees internes. En entretien, on evalue la capacite a choisir la b…
Lire l'article →Recruter un Data Engineer ou Data Scientist est différent d un recrutement classique. Ce guide couvre toutes les étapes du process…
Lire l'article →Au-dela des competences techniques, un entretien revele des signaux subtils sur la posture, la rigueur et la capacite a travailler…
Lire l'article →La régression logistique est souvent le premier algorithme demandé en entretien. Mais la maîtriser vraiment — coefficients, régula…
Lire l'article →Connaitre les salaires du marche est indispensable pour recruter et negocier. Voici les fourchettes constatees en 2025 en France, …
Lire l'article →Le scraping va au-dela de BeautifulSoup sur un site statique. En entretien Data Engineer Senior, on evalue la capacite a gerer les…
Lire l'article →Le web scraping est une compétence Data Engineer courante pour collecter des données non disponibles via API. En entretien, on éva…
Lire l'article →La sécurité des données est une responsabilité du Data Engineer, pas seulement du RSSI. En entretien, on évalue la capacité à conc…
Lire l'article →Snowflake n est pas juste un data warehouse SQL. En entretien Senior, on eval...
Lire l'article →Au-delà des bases Snowflake, l optimisation des performances nécessite de maîtriser le Query Profile, le clustering intelligent et…
Lire l'article →Les 5 dimensions d'un entretien Snowflake : architecture, Time Travel, Streams/Tasks, couts, gouvernance.
Lire l'article →Au-dela des DataFrames de base, un Data Engineer Spark Senior maitrise le streaming, Delta Lake et l optimisation fine des jobs. C…
Lire l'article →Spark Structured Streaming est la solution de streaming de référence dans l écosystème Spark. En entretien, on évalue la maîtrise …
Lire l'article →Les 5 dimensions d'un entretien Spark : transformations/actions, lazy execution, RDD, partitionnement, optimisation.
Lire l'article →Au-delà des window functions classiques, certains patterns SQL analytiques différencient vraiment les profils experts. En entretie…
Lire l'article →Tout le monde sait faire un SELECT avec JOIN. Ce qu on evalue en entretien Senior, c est la maitrise des window functions, l ecrit…
Lire l'article →Les 5 dimensions d'un entretien SQL : jointures, agregations, window functions, optimisation, modelisation.
Lire l'article →Modern Data Stack, Lakehouse, Data Mesh — le marché propose de nombreuses architectures. En entretien Lead ou Architect, on évalue…
Lire l'article →Un entretien mal structuré évalue les candidats de manière incohérente et rate les bons profils. Voici comment structurer un entre…
Lire l'article →Les données synthétiques permettent de tester les pipelines et entraîner des modèles sans exposer de données réelles. En entretien…
Lire l'article →LOD expressions, calculs de table, Tableau Prep, dashboards dynamiques et gouvernance — ce qu'on évalue vraiment dans un entretien…
Lire l'article →Tableau Server Client (TSC) est la bibliotheque Python officielle pour automatiser l administration de Tableau Server ou Tableau C…
Lire l'article →Les 5 dimensions d'un entretien Tableau : vues, calculs, LOD expressions, Tableau Prep, performance.
Lire l'article →Terraform est devenu incontournable pour les Data Engineers qui provisionnent des ressources cloud. En entretien, on evalue la cap…
Lire l'article →Les A/B tests mal conduits mènent à de mauvaises décisions business. En entretien Senior, on évalue la rigueur statistique : puiss…
Lire l'article →Un pipeline data sans tests est une bombe à retardement. En entretien Senior, on évalue la capacité à écrire des tests automatisés…
Lire l'article →Les données temporelles ont des propriétés spécifiques (autocorrélation, saisonnalité, trend) qui nécessitent des méthodes dédiées…
Lire l'article →Trino (ex-Presto) est le moteur SQL de référence pour interroger plusieurs sources de données depuis une seule requête. En entreti…
Lire l'article →Discovery utilisateur, Double Diamond, wireframes, choix des visuels, hiérarchie d'information — ce qu'on évalue dans un entretien…
Lire l'article →Le web analytics est un metier a part dans la data. GA4 et le tracking server-side ont transforme les pratiques depuis 2023. En en…
Lire l'article →XGBoost et Random Forest sont les algorithmes les plus utilisés en data science tabulaire. En entretien, on va au-delà de l usage …
Lire l'article →