Je postule




Data Scientist

31/10/2024
Casablanca
Freelance
BAC+5

 Poste

Pour le compte de notre client, nous recherchons un consultant Data Scientist pour une mission de longue durée à Casablanca.

Missions :

  • Collecte de données : Identifier et rassembler des données pertinentes à partir de diverses sources, qu’elles soient internes (bases de données de l’entreprise) ou externes ‘API, web scraping, etc.).

  • Préparation et nettoyage des données : Nettoyer et transformer les données pour les rendre exploitables. Cela inclut le traitement des valeurs manquantes, la normalisation des formats, et l’élimination des doublons.

  • Analyse exploratoire : Analyser les données pour en dégager des insights préliminaires. Cela peut inclure des visualisations des statistiques descriptives et la recherche de corrélations.

  • Modélisation : Développer les modèles statistiques ou de machine learning pour résoudre des problèmes spécifiques (prédiction, classification, etc).  cela implique le choix  de l’algorithme, l’entrainement du modèle et l’évaluation de ses performances.

  • Interprétation des résultats : Interpréter les résultats des analyses et des modèles, en traduisant les données en recommandations concrètes et en insights exploitables pour les décideurs.

Qualifications :

  • Langages de programmation : Python et R sont les plus couramment utilisés pour l’analyses de données et le machine learning.

  • Outils de manipulation de données : Pandas et NumPy pour Python, dplyr pour R.

  • Visualisation : Matplotib, seaborn, Plotly pour Python, ggplot2 pour R.

  • Bases de données : SQL pour interroger des bases de données relationnelles, ainsi que NoSQL comme Cassandra.

  • Environnement de développmeent : Jupyter Notebook, RStudio et IDE comme PyCharm.

  • Machine learning : Scikit-leart, TensorFlow, Keras et PyTorch pour developer des modèles.

  • Big Data : Hadoop, Spark pour traiter de grandes qualtités de données.

  • Outils de versionnage : Git pour gérer le code.

  • Outils de déploiement : Docker, Kubernetes pour la mise en production des modèles.