À propos de Thomas
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- Sapia TechFormateur data analytics et machine learningEDUCATION & E-LEARNINGoctobre 2021 - octobre 2021Paris, FranceConception et animation d'un cours d'analyse de données massives avec python via l'analyse statistiques et la mise en place d'algorithmes de Machine Learning pour des applications diverses :⦁ Fouille automatique de données⦁ Classification automatique de données (classification supervisée)⦁ Regroupement automatique de données (clustering)⦁ Réduction de dimension⦁ Traitement automatique du langage naturel (NLP)
- La PosteData scientist en freelanceCONSEIL & AUDIToctobre 2019 - Aujourd'hui (6 ans et 8 mois)Guyancourt, FranceAu sein du pôle Big Data Analytics à Guyancourt, j’ai occupé le poste de data scientist et je suis intervenu sur 3 projets au cours de ces deux dernières années dans un environnement CDH (Cloudera Distribution including Hadoop) et particulièrement HDFS, Impala, Hive et Spark⦁ Recueil des besoins métiers⦁ Rédaction des expressions de besoins⦁ Développement en Spark (Scala et Python), Panda et intégration Jenkins⦁ Rédaction des demandes sur Jira⦁ Résolution de problèmes techniques pour les developpeurs du DataLake (config GPU, Spark, installations paquets python …)⦁ Gestion de ressources du Cluster (cloudera manager)⦁ Tests et intégration : Unitest, Sonarcube et Jenkins⦁ Utilisation de Gitlab et Jenkins pour l’intégration continue⦁ Rédaction de la documentation technique Confluence (commande de lancement, périmètres d’actions…)⦁ Rédaction des dossiers d’exploitations⦁ Travail d’optimisation de manipulation de données avec DSS⦁ Conception d’un algorithme de classification non supervisé des données courrier basé sur l’algorithme d’OPTICS de la librairie python scikit-learn (pySpark, scikit-learn)⦁ Conception et entraînement d’un algorithme de Deep Learning pour le parsing d’adresses postales basé sur une génération synthétique d’adresses à partir de référentiels adresses et un réseau de portes GRU (PySpark, keras, tensorflow)⦁ Mise en place d’un pipeline d’entraînement et application d’un algorithme de Deep Learning dans un environnement Spark avec GPU (pySpark, keras, tensorflow)⦁ Intervention sur le datalake et (7 tables différentes mise en production de OPTICS et des algorithmes de parsing)⦁ Entraînement d'un modèle de reconnaissance vocale (STT) via le toolkit nemo de Nvidia : préparation des données, fine tuning, recette du modèle⦁ Fine tuning d'un modèle NER (Named Entity Recognition) Transformers pour la reconnaissance d'entités adresses et destinataires⦁ Fine tuning d'un modèle de reconnaissance d'objet via la pipeline YOLOv5 pour la reconnaissance de DCP dans des documents non formatés (scan PDF, images, etc)
- Sopra SteriaStagiaire data scientistAGENCE & SSIIavril 2019 - octobre 2019 (6 mois)Région de Paris, FranceEn mission chez La Poste j'ai occupé un rôle de data ingénieur pour la complétion de référentiels adresses après nettoyage, filtrage et sélections d'éléments adresses ainsi que data scientist lors de la mise en place d'un environnement de développement pour le deep learning et la conception d'un réseau de parsing d'adresses⦁ Recueil des besoins métiers⦁ Rédaction des expressions de besoins⦁ Développement en Spark (Scala et Python), Panda et intégration Jenkins⦁ Rédaction des demandes sur Jira⦁ Gestion de ressources du Cluster (cloudera manager)⦁ Tests et intégration : Unitest, Sonarcube et Jenkins⦁ Utilisation de Gitlab et Jenkins pour l’intégration continue⦁ Conception d'une solution Deep Learning pour le parsing d'adresses⦁ Intervention sur le datalake, en recette et mise en production⦁ Configuration d'une carte graphique (Tesla V100) et mise en place d'une structure pour faciliter le développement et l'échange de données⦁ Complétion d'un référentiel adresse à partir de la donnée des lettres scannées en pySpark
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Diplôme d'ingénieurENSTA ParisTech - École Nationale Supérieure de Techniques Avancées2019Cursus ingénieur : 3ème année en voie Intelligence Artificielle avec une spécialisation en entreprenariat /intrapreneuriat 2ème année en voie Signal, Informatique et Systèmes spécialité Technologies de l'Information et des Communications
- LicenceInstitut Villebon Georges Charpak2016Licence en Science et Technologie avec spécialisation en IPMI (Informatique Physique Mathématique et Ingénierie)