You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Sacha DuSD

Sacha Du

Data scientist, Développeur python 5 ans

555 €/jour
Paris 14e Arrondissement, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Sacha

Bonjour,

J’ai suivi le master Informatique, Mathématiques et Statistiques appliquées à l’école d’ingénieurs Télécom SudParis, promo 2016. J'évolue depuis dans le monde professionnel et tout le long de mes expériences, ma casquette a oscillé entre Data Scientist et Data Engineer. Essentiellement, mon travail consiste à conceptualiser et maintenir des applications de machine learning ou de data processing. Quotidiennement cela revient à:
- Récupérer et cadrer un besoin auprès d’un métier (définition d'objectifs, de mesures de performance...),
- Formaliser le besoin et récupérer les données disponibles et pertinentes (SQL/Spark/Hive.Pyspark...)
- Faire de la veille technologique sur les méthodes disponibles (beaucoup de lecture de papiers état de l’art)
- Implémenter un POC
- Déployer le modèle en production (on premise ou sur le cloud)

En parallèle de mon parcours professionnel j'ai toujours été proche du milieu de l'enseignement. J'ai donné des cours de Data Science pour le bootcamp Jedha, j'ai donc une certaine facilité pour communiquer et transmettre mes idées.
Pour de plus amples informations sur les projets sur lesquels j’ai pu travailler je vous laisse consulter mon profil Linkedin.

Concernant ma stack technique:
- Big Data / Traitement de données: SQL, Hive, Spark, Pyspark, BigQuery, Redshift
- Machine Learning: Python (scikit-learn, tensorflow, tensorflow probability), Spark ML, R
- Production: Git, Concourse, Docker, Flask
- Cloud: environnements Google Cloud et AWS
- Dataviz: Plotly, Bokeh, R-Shiny.
Je suis disponible pour toute question, vous avez mes coordonnées dans mon CV alors n'hésitez pas !

À très vite,
Sacha
  • Français

    Bilingue ou natif

Accepte de travailler sur site
Paris 14e Arrondissement (jusqu’à 50 km)

Expériences

  • Jedha Bootcamp
    Professeur de Data Science
    HIGH TECH
    janvier 2020 - décembre 2020 (1 an)
    Paris, France
    Jedha Bootcamp est un bootcamp (un cours accéléré) en Data Science qui propose des formations allant
    de 3 à 6 mois.

    Chaque module s’étale sur 1 mois et demi et a lieu le lundi soir et le samedi toute la journée.

    Les classes sont constituées d’une vingtaine d’élèves possédant un niveau suffisant pour pouvoir suivre le
    bootcamp.

    Dans ce cadre, j’ai animé les 3 modules suivants: Python / Analyses Statistiques / Deep Learning
    Python Enseignement SQL Machine learning git
  • Pôle emploi
    Lead Data Scientist
    SECTEUR PUBLIC & COLLECTIVITÉS
    juillet 2019 - octobre 2021 (2 ans et 3 mois)
    Paris, France
    Lead Data Scientist Intégré au département Big Data au sein de la direction générale de Pôle Emploi. Mise en production d'algorithmes d'IA dans le cadre du projet Intelligence Emploi:

    • Elaboration d'un cockpit à destinations des conseillers entreprise pour objectiver la prise de décision tout au long de la gestion des offres d'emploi.
    - Prédiction du délai de pourvoi d'une offre d'emploi
    - Comparaison du délai prédit à celui d'offres similaires sur un même contexte géo-économique
    - Scoring de l'offre relativement au contexte
    - Explication des prédictions avec des outils de machine learning pour accompagner conseillers et recruteurs dans leurs prises de décision.

    • Création d'un outil de ciblage d'entreprises avec un fort potentiel d'embauche pour aider les conseillers entreprise dans leur démarche de prospection et de promotion de profil de demandeur d'emploi.
    - Modèle LSTM qui utilise les embauches passées des entreprises + des données "statiques" sur l'entreprise + des indicateurs géo-économiques sur le bassin d'emploi.
    - Prédiction du nombre d'embauches avec une granularité au semestre

    Livrables:

    Représentant du département Big Data au sein du projet, discussions avec les équipes métier pour
    définir et suivre le besoin et les exigences du projet (définition des KPI, etc)

    Listing et récupération des données sous Python/Spark

    Listing des librairies Python et implémentation de plusieurs algorithmes (XGBoost, RandomForest,
    Réseau de Neurones) pour prédire le délai de pourvoi d’une offre d’emploi, séléction du meilleur
    modèle Python scikit-learn/tensorflow

    Packaging de l’application Python

    Mise en production du meilleur modèle une fois que les KPIs ont été atteints (échanges avec les
    équipes DSI pour les exigences fonctionnelles, implémentation de l’API en Python/Flask et
    Dockerisation)

    Modelisation, Machine Learning - Deep Learning: Python / Scikit-learn / Tensorflow Probability / LIME / SHAP
    Mise en production: Python / Hive / Docker / Flask - API REST
    Tech Lead Data science Machine learning Python Spark Git Docker API REST Artifactory
  • Zenly
    Consultant Data Scientist
    EDITION DE LOGICIELS
    janvier 2019 - avril 2019 (4 mois)
    Paris, France
    Zenly est un réseau social géolocalisé qui permet de voir ses amis en temps réel sur une map.

    Dans ce cadre et dans le but d’améliorer le produit, j’ai été contacté pour implémenter un algorithme de détection de mode de transport en temps réel utilisant les données de sensors des smartphones des utilisateurs. Les sensors sont par exemple l’accelérometre, le GPS ou le baromètre. Ils fournissent une
    représentation physique de l’état du téléphone.

    Les différents modes de transport prédits sont: Statique, marche, cours, à vélo, motorisé, train

    Livrables:
    Étude de l’état de l’art, veille technologique

    Collecte des données des différentes sources notamment les données d’accelérometre et de GPS générés par des smartphones de l’entreprise ou des bases de données

    Mise en forme des données (harmonisation de l’échantillonage entre les différentes sources notamment) (Python/Numpy)

    Traitement de données: data augmentation, data flipping, data rotation

    Algorithme de traitement du signal via un réseau de neurones convolutionnel qui prédit le mode de transport actuel d’un individu par tranche de 0.3ms (Python/Tensorflow)

    Évaluation du modèle (optimisation, calcul d’hyper-paramètres optimaux…) => Accuracy globale de 92%

    Implémentation d’un démonstrateur sur smartphone pour pouvoir tester le modèle entraîné en temps réel. Le démonstrateur est implémentée en Java et embarque le modèle au format TensorflowLite (adapté pour être shippé sur mobile). L’application affiche en temps réel la probabilité de chaque mode de transport

    Rédaction de documentation technique.
    Python Spark Deep Learning Git Java Google cloud

Recommandations

Soyez le premier à recommander Sacha

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Ingénieur Spécialité Informatique, Mathématiques et statistiques appliquées
    Télécom SudParis
    2016
    - Programmation: Python, SQL, R, Bash, Java, C - Réseaux: Tcp-ip - Statistiques: Biostatistiques, Probabilités - Mathematiques-Probabilites: Bayesian Probabilities, Optimization methods, Hidden Markov models, Kalman filtering - Machine Learning: Data mining, Factorial Analysis, Prediction algorithms, Clustering - Deep Learning : Deep Networks, Convolution networks, Recurrent networks
  • Analyse multivariée
    CNAM collège de FRANCE
    2019
    Formation d'un semestre spécialisé dans les mathématiques appliquées: - Statistiques - Machine learning - Deep learning

Compétences (31)

Catégories