Je suis un Data Scientist utilisant Python et Spark ML, cofondateur de Effets Mesurés (Vente de vêtements sur mesure en ligne chez mue-store.fr), dont j'ai développé l'algorithme de prise de mesure.
J'ai été habitué à produire du code de qualité grâce aux exigences et à la rigueur de ma formation au métier d'ingénieur à l'EPITA (Promo SCIA 2018, Data Science/Data Engineer)
Je peux intervenir sur des sujets en Python et Keras/Tensorflow, Pytorch, Vue.js; principalement sur des sujets de Computer vision mais aussi de NLP.
Je peux prendre en charge différentes étapes du pipeline d'intelligence artificielle :
Analyse des besoins:
- Dialogue avec le client pour permettre de cibler et exprimer clairement le besoin
- Traduction en pipeline de machine learning répondant aux critères retenus
Récupération de données :
- Scraping (selenium, scrapy)
- Appel API diverses : google sheet, pipedrive, pubmed etc.
Traitement de données :
- Lecture de fichiers
- Nettoyage et traitement de données (panda, numpy, etc)
- Stockage de données et transformation à l'aide de base SQL ou noSQL
Visualisation de données
- Librairies de visualisation de python : matplotlib, seaborn, plotly
- Génération de dashboard avec PowerBI (microsoft) et QuickSight (AWS)
Analyse, prédiction et classification de données
- Analyse préalable des données
- Entraînement de modèle de machine learning ou de Deep Learning
- Utilisation de ChatGPT pour faire du Question Answering avec une base de données vectorielle (FAISS, pinecone, etc) ou pour le lier a une API interne (recommandation de produits, etc)
- Choix des métriques de performances et analyse des performance pour valider le modèle
Création d'application conteneurisé (docker)
- Création d'API avec Flask, FastAPI
- Création d'application avec streamlit et Flask, deployement sur AWS ou GCP