AccueilBlogTest technique Dataiku
Guide recrutement data

Test technique Dataiku : ce qu'on evalue en entretien Data Scientist

Dataiku est la plateforme data collaborative la plus adoptee en grande entreprise francaise. Voici comment evaluer la maitrise reelle.

Data Builder·Juin 2025·7 min de lecture·Data Scientist · Analytics Engineer

Dataiku est la plateforme data collaborative la plus adoptee en grande entreprise francaise. Evaluer un profil Dataiku, c'est evaluer sa capacite a travailler dans un environnement collaboratif structure.

1Projets et flows

Question discriminante

Qu'est-ce qu'un projet Dataiku ? Difference entre dataset, recette et flow ?

Un projet contient des datasets (donnees), des recettes (transformations) et un flow (le DAG visuel qui connecte tout).

  • Datasets — fichiers, tables SQL, S3, API — tout est un dataset
  • Recettes : visual, SQL, Python, R, Spark
  • Flow — DAG visuel partage avec l'equipe
  • Scenarios — orchestration automatique du flow

2Preparation de donnees

Question discriminante

Quand utilisez-vous la recette Prepare visuelle plutot qu'une recette Python ou SQL ?

  • Prepare — 100+ processeurs visuels, accessible aux non-developpeurs
  • SQL — transformations poussees vers la base
  • Python/R — logique complexe, bibliotheques externes
  • Spark — traitement a grande echelle

3Machine Learning

Question discriminante

Decrivez le workflow de creation d'un modele ML dans Dataiku jusqu'au deploiement.

  • Visual ML — creation de modeles sans code
  • Lab — experimentation et comparaison de modeles
  • Saved Model — modele versionne deploye dans le flow
  • SHAP values — explicabilite des predictions

4MLOps et deploiement

Question discriminante

Comment gerez-vous le retraining automatique d'un modele en production ?

  • Model drift detection — surveiller la degradation des performances
  • Scenarios et triggers — retraining automatique sur condition
  • API deployment — via Design Node ou API Node dedie

5Gouvernance et collaboration

Question discriminante

Comment organisez-vous la collaboration entre data scientists et data analysts sur un meme projet ?

  • Connexions partagees — centraliser les acces aux sources
  • Bundles — packager et deployer des projets entre instances
  • Fleet Manager — gouvernance multi-instances

6Grille par niveau

NiveauMaitrise attendueSignal GONO-GO
JuniorNavigation projets, recette Prepare, Visual ML basiqueComprend la difference dataset/recette/flowNe sait pas quand choisir Python vs recette Prepare
ConfirmeRecettes Python/SQL, Lab ML, Saved Models, ScenariosA deploye un modele et automatise son retrainingN'a jamais configure de drift detection
SeniorMLOps, API deployment, Fleet Manager, explicabiliteA gere le cycle de vie complet d'un modele en prodNe connait pas les bundles ni le Fleet Manager
LeadArchitecture multi-projets, gouvernance, standards equipeA defini les standards Dataiku pour l'organisationNe peut pas expliquer Design Node vs API Node

Vous recrutez un profil data ?

Premier entretien gratuit. Rapport GO/NO-GO sous 48h.

Tester gratuitementReserver un appel