À propos de Julien
Anglais
Capacité professionnelle complète
Français
Bilingue ou natif
Italien
Capacité professionnelle limitée
Expériences
- LeihiaData Scientistjuillet 2020 - juillet 2020Rueil-Malmaison, Île-de-France, FranceMise en place d’un algorithme d’intelligence artificielle pour faire matcher le Candidat idéal pour le bon job dans la bonne entreprise.
- Projet d'étudesData Scientist - AWSjanvier 2020 - mars 2020 (2 mois)Mennecy, Île-de-France, FranceDéployez un modèle dans le Cloud Préparation d’un modèle de classification d’images en tenant compte d’une future mise à l’échelle des calculs due à l’augmentation du volume de données. Outils utilisés : - Langage : Python 3.6 - Environnement : Linux Mint – VirtualEnv – JupyterLab – AWS – Git & GitHub - Librairies : Spark 2.4.5 – OpenCV – Boto3 Travaux réalisés : - Code : - Preprocessing d’un modèle de classifieur par chargement des images dans un dataframe Spark. - Extraction des descripteurs de chaque image avec l’algorithme ORB inclut dans OpenCV. - Enregistrement du dataframe final au format parquet. - Déploiement sur AWS : - Création d’un dépôt S3, avec AWS CLI et sans. - Création d’une instance EMR pour la distribution des calculs. - Configuration des rôles dans AWS IAM. - Utilisation d’un Notebook EMR pour charger et visualiser les résultats.
- Projet d'étudesData Scientist - Azuredécembre 2019 - janvier 2020 (1 mois)Mennecy, Île-de-France, FranceImplémentez un modèle de Scoring Prédiction de risque de faillite d’un client pour une entreprise de crédits. Outils utilisés : - Langage : Python 3.7.5 - Environnement : Windows – VirtualEnv – JupyterLab – Microsoft Azure – Git & GitHub - Librairies : Pandas – Numpy – Matplotlib – Seaborn – Scikit-Learn – imblearn – XGBoost – Streamlit – Flask – Docker Travaux réalisés : - Classification binaire sur un jeu de données déséquilibré. - Preprocessing des données avec rééquilibrage des données. - Essai de plusieurs modèles : Régression logistique – Random Forest – Xgboost. - Optimisation du modèle le plus prometteur. - Etudes des différentes métriques : Accuracy – Precision – Recall – F1Score - Matrice de confusion – Courbe ROC – Score AUC – Features Importances - Réalisation d’un Dashboard avec Flask et Streamlit. - Déploiement du modèle sur Microsoft Azure : Docker – Registry – Azure Service Plan – Web App Service – Azure CLI - Voir mon article LinkedIn expliquant en détails la procédure
Recommandations
Soyez le premier à recommander Julien
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Data ScientistOpenClassRooms2020Parcours Data Scientist sur la plateforme OpenClassRooms : https://openclassrooms.com/fr/paths/164-data-scientist Ce parcours est constitué de sept projets professionnalisant dont vous pouvez voir le détail dans le lien ci-dessus. Chacun de ces projets contient sa spécificité, ce qui m'a permis d'acquérir des compétences dans : - Python - Jupyter Notebook - Environnements virtuels - Le Data Mining ( Analyse, Compréhension, Nettoyage, Mise en forme, Visualisation des données) - La régression supervisée, non supervisée - La classification supervisée, non supervisée - Le clustering - Le traitement de texte et d'image - Le développement d'API - La création de Dashboard - Le déploiement sur le Cloud - Le Big Data
- Data ScientistOpenClassrooms2020Huit projets professionnalisant à valider auprès d'un jury : - Analyse exploratoire de base de données. Aide décisionnelle d’expansion à l’international d’une entreprise de cours en ligne. - Proposition d’application en lien avec l’alimentation. - Prédiction de conso de CO2 et conso totale des bâtiments de Seattle en se basant sur des bases de données existantes. - Comprendre les différents types d’utilisateurs grâce à leur comportement et à leurs données personnelles. Evaluer la fréquence à laquelle la segmentation doit être mise à jour. - Réaliser une première étude de faisabilité d'un moteur de classification en se basant sur une image et une description pour l’automatisation de l’attribution de la catégorie de l’article. - Prédiction de risque de faillite d’un client pour une entreprise de crédits. - Préparation d’un modèle de classification d’images en tenant compte d’une future mise à l’échelle des calculs due à l’augmentation du volume de données.
Certifications
- SQL pour la Data Science de A à Z (analyse de data réelles)Udemy2020