Linux est l'environnement de production de la quasi-totalite des infrastructures data. Voici comment evaluer la maitrise reelle du terminal.
Linux est l'environnement de production de la quasi-totalite des infrastructures data. Un Data Engineer qui ne maitrise pas le terminal est bloque sur les serveurs de production.
Expliquez l'arborescence Linux. Que contiennent /etc, /var, /home et /tmp ?
find /var/log -name "*.log" -mtime -1
ls -lah | sort -k5 -rh | head -10Vous devez trouver toutes les lignes ERROR dans un fichier de logs de 2 Go. Quelle commande ?
grep "ERROR" /var/log/app.log | wc -l
grep "ERROR" /var/log/app.log | sort | uniq -c | sort -rn | head -20
tail -f /var/log/app.log | grep --line-buffered "CRITICAL"Ecrivez un script bash qui verifie si un fichier existe et le deplace dans un dossier archive.
#!/bin/bash
FILE="/data/incoming/export.csv"
if [ -f "$FILE" ]; then
DATE=$(date +%Y%m%d)
mv "$FILE" "/data/archive/export_$DATE.csv"
else
echo "Fichier introuvable"; exit 1
fiQu'est-ce que la variable PATH ? Que se passe-t-il si une commande n'est pas dans PATH ?
Un processus Airflow semble bloque. Quelles commandes utilisez-vous ?
| Niveau | Maitrise attendue | Signal GO | NO-GO |
|---|---|---|---|
| Junior | Navigation, ls/cd/pwd, grep, cp/mv/rm | Comprend les pipes, cherche dans les logs | Ne sait pas ce qu'est PATH |
| Confirme | Scripts bash, cron, chmod, variables env | A ecrit des scripts avec conditions et boucles | N'a jamais ecrit un script bash |
| Senior | Processus, monitoring, redirections, nohup | Diagnostique un processus bloque | Ne sait pas tuer un processus |
| Lead | Administration systeme, securite, standards equipe | A mis en place des scripts de monitoring | Ne peut pas expliquer chmod 755 |
Premier entretien gratuit. Rapport GO/NO-GO sous 48h.