Description

Bonjour,

J’ai suivi le master Informatique, Mathématiques et Statistiques appliquées à l’école d’ingénieurs Télécom SudParis, promo 2016. J'évolue depuis dans le monde professionnel et tout le long de mes expériences, ma casquette a oscillé entre Data Scientist et Data Engineer. Essentiellement, mon travail consiste à conceptualiser et maintenir des applications de machine learning ou de data processing. Quotidiennement cela revient à:

- Récupérer et cadrer un besoin auprès d’un métier (définition d'objectifs, de mesures de performance...),

- Formaliser le besoin et récupérer les données disponibles et pertinentes (SQL/Spark/Hive.Pyspark...)

- Faire de la veille technologique sur les méthodes disponibles (beaucoup de lecture de papiers état de l’art)

- Implémenter un POC

- Déployer le modèle en production (on premise ou sur le cloud)

En parallèle de mon parcours professionnel j'ai toujours été proche du milieu de l'enseignement. J'ai donné des cours de Data Science pour le bootcamp Jedha, j'ai donc une certaine facilité pour communiquer et transmettre mes idées.

Pour de plus amples informations sur les projets sur lesquels j’ai pu travailler je vous laisse consulter mon profil Linkedin.

Concernant ma stack technique:

- Big Data / Traitement de données: SQL, Hive, Spark, Pyspark, BigQuery, Redshift

- Machine Learning: Python (scikit-learn, tensorflow, tensorflow probability), Spark ML, R

- Production: Git, Concourse, Docker, Flask

- Cloud: environnements Google Cloud et AWS

- Dataviz: Plotly, Bokeh, R-Shiny.

Je suis disponible pour toute question, vous avez mes coordonnées dans mon CV alors n'hésitez pas !

À très vite,

Sacha

Langues

Français
Bilingue ou natif

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris 14e Arrondissement (jusqu’à 50 km)

Jedha Bootcamp
Professeur de Data Science
HIGH TECH
janvier 2020 - décembre 2020 (1 an)
Paris, France
Jedha Bootcamp est un bootcamp (un cours accéléré) en Data Science qui propose des formations allant
de 3 à 6 mois.

Chaque module s’étale sur 1 mois et demi et a lieu le lundi soir et le samedi toute la journée.

Les classes sont constituées d’une vingtaine d’élèves possédant un niveau suffisant pour pouvoir suivre le
bootcamp.

Dans ce cadre, j’ai animé les 3 modules suivants: Python / Analyses Statistiques / Deep Learning
Python Enseignement SQL Machine learning git
Pôle emploi
Lead Data Scientist
SECTEUR PUBLIC & COLLECTIVITÉS
juillet 2019 - octobre 2021 (2 ans et 3 mois)
Paris, France
Lead Data Scientist Intégré au département Big Data au sein de la direction générale de Pôle Emploi. Mise en production d'algorithmes d'IA dans le cadre du projet Intelligence Emploi:

• Elaboration d'un cockpit à destinations des conseillers entreprise pour objectiver la prise de décision tout au long de la gestion des offres d'emploi.
- Prédiction du délai de pourvoi d'une offre d'emploi
- Comparaison du délai prédit à celui d'offres similaires sur un même contexte géo-économique
- Scoring de l'offre relativement au contexte
- Explication des prédictions avec des outils de machine learning pour accompagner conseillers et recruteurs dans leurs prises de décision.

• Création d'un outil de ciblage d'entreprises avec un fort potentiel d'embauche pour aider les conseillers entreprise dans leur démarche de prospection et de promotion de profil de demandeur d'emploi.
- Modèle LSTM qui utilise les embauches passées des entreprises + des données "statiques" sur l'entreprise + des indicateurs géo-économiques sur le bassin d'emploi.
- Prédiction du nombre d'embauches avec une granularité au semestre

Livrables:

Représentant du département Big Data au sein du projet, discussions avec les équipes métier pour
définir et suivre le besoin et les exigences du projet (définition des KPI, etc)

Listing et récupération des données sous Python/Spark

Listing des librairies Python et implémentation de plusieurs algorithmes (XGBoost, RandomForest,
Réseau de Neurones) pour prédire le délai de pourvoi d’une offre d’emploi, séléction du meilleur
modèle Python scikit-learn/tensorflow

Packaging de l’application Python

Mise en production du meilleur modèle une fois que les KPIs ont été atteints (échanges avec les
équipes DSI pour les exigences fonctionnelles, implémentation de l’API en Python/Flask et
Dockerisation)

Modelisation, Machine Learning - Deep Learning: Python / Scikit-learn / Tensorflow Probability / LIME / SHAP
Mise en production: Python / Hive / Docker / Flask - API REST
Tech Lead Data science Machine learning Python Spark Git Docker API REST Artifactory
Zenly
Consultant Data Scientist
EDITION DE LOGICIELS
janvier 2019 - avril 2019 (4 mois)
Paris, France
Zenly est un réseau social géolocalisé qui permet de voir ses amis en temps réel sur une map.

Dans ce cadre et dans le but d’améliorer le produit, j’ai été contacté pour implémenter un algorithme de détection de mode de transport en temps réel utilisant les données de sensors des smartphones des utilisateurs. Les sensors sont par exemple l’accelérometre, le GPS ou le baromètre. Ils fournissent une
représentation physique de l’état du téléphone.

Les différents modes de transport prédits sont: Statique, marche, cours, à vélo, motorisé, train

Livrables:
Étude de l’état de l’art, veille technologique

Collecte des données des différentes sources notamment les données d’accelérometre et de GPS générés par des smartphones de l’entreprise ou des bases de données

Mise en forme des données (harmonisation de l’échantillonage entre les différentes sources notamment) (Python/Numpy)

Traitement de données: data augmentation, data flipping, data rotation

Algorithme de traitement du signal via un réseau de neurones convolutionnel qui prédit le mode de transport actuel d’un individu par tranche de 0.3ms (Python/Tensorflow)

Évaluation du modèle (optimisation, calcul d’hyper-paramètres optimaux…) => Accuracy globale de 92%

Implémentation d’un démonstrateur sur smartphone pour pouvoir tester le modèle entraîné en temps réel. Le démonstrateur est implémentée en Java et embarque le modèle au format TensorflowLite (adapté pour être shippé sur mobile). L’application affiche en temps réel la probabilité de chaque mode de transport

Rédaction de documentation technique.
Python Spark Deep Learning Git Java Google cloud

Consulter toutes les expériences de Sacha

Soyez le premier à recommander Sacha

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Ingénieur Spécialité Informatique, Mathématiques et statistiques appliquées
Télécom SudParis
2016
- Programmation: Python, SQL, R, Bash, Java, C - Réseaux: Tcp-ip - Statistiques: Biostatistiques, Probabilités - Mathematiques-Probabilites: Bayesian Probabilities, Optimization methods, Hidden Markov models, Kalman filtering - Machine Learning: Data mining, Factorial Analysis, Prediction algorithms, Clustering - Deep Learning : Deep Networks, Convolution networks, Recurrent networks
Analyse multivariée
CNAM collège de FRANCE
2019
Formation d'un semestre spécialisé dans les mathématiques appliquées: - Statistiques - Machine learning - Deep learning

Sacha Du

Data scientist, Développeur python 5 ans

À propos de Sacha

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Compétences (31)

Catégories