- VizcabData ingénieur / DéveloppeurEDITION DE LOGICIELSavril 2024 - Aujourd'hui (12 mois)Paris, France- Conçoit et développe de nouveaux pipelines de données dans Azure Databricks pour l'ingestion de données vers/depuis des applications produits, Azure Data Lake et des bases de données PostgreSQL.- Crée et optimise des modèles pour organiser et structurer les données issues de diverses applications et sources, afin de les rendre exploitables par les utilisateurs.- Développe et maintient des tableaux de bord Power BI et Databricks pour visualiser les informations, surveiller les performances des pipelines et garantir la qualité des données.- Améliore la qualité du code en appliquant les meilleures pratiques et en établissant des pipelines CI/CD robustes grâce à Databricks Bundle Assets, GitLab et SonarQube.- Développe et met en œuvre des contrats de données comme cadre pour surveiller les modèles de données et définir des spécifications claires.- Collabore avec les équipes métiers pour identifier leurs besoins et fournir des solutions de données sur mesure qui apportent de la valeur.
- EQUILIBRIUM SOLUTIONS LTD, UKData Ingénieur Senior / DéveloppeurAGENCE & SSIIseptembre 2022 - Aujourd'hui (2 ans et 6 mois)Manchester, Royaume-Uni- Collecte, transforme et restitue des données en provenance d’applications diverses qui permettent de suivre de près les activités des clients- Développement d’application et pipelines d’intégration des données de sources et formats différents. Ingestion et transformation dans le datalake. Orchestration des workflows de pipeline de données. Implémentation des tests unitaires et d’intégration.- Web Scrapping de données publiques pour enrichir la donnée interne- Modélisation des données- Indexation des données dans Elasticsearch- Construction des dashboards à destination du Marketing (Tableau)- Migration d’une application on-premises vers AWS
- Cour des comptes, Paris.Machine learning ingénieur / Project LeadSECTEUR PUBLIC & COLLECTIVITÉSdécembre 2017 - août 2022 (4 ans et 8 mois)● Conçoit et supervise l’architecture et le développement de la plateforme de recherche unifiée de la Cour des comptes basée sur un datalake Hadoop.● Construit les pipelines de scrapping Python pour collecter des pages HTML des rapports produits par la Cour des comptes de 1870 à 2022 (180 k+).● Crée et développe les projets Python pour extraire les textes bruts de 250 k+ rapports de types PDF, Word, HTML, Images documents (OCR), etc.● Implémente des programmes Python pour nettoyer, traiter et structurer les données hétérogènes, et surtout identifier les connexions entre les données pour leur indexation (Elasticsearch) et leur analyse textuelle.● Dirige et développe les pipelines Spark d’ingestion des contenus en provenance de diverses bases de données (ex: contrôles, référentiel des agents de la Cour, ...).● Développe collaborativement la plateforme Web du moteur de recherche (React, Django).● Réalise un POC NER (Reconnaissance d'Entités Nommées) pour extraire automatiquement les noms et expressions pertinentes dans le texte des rapports (Spacy, Deep learning).● Organise et dirige les workshops d’annotation manuelle (Doccano) des rapports pour constituer une base d’apprentissage du POC NER propre au contexte de la Cour des comptes.● Organise plusieurs ateliers utilisateurs pour collecter les besoins internes sur la recherche efficace de textes, l’organisation des documents et les liens logiques entre les informations.● Travaille main à main avec l’UX designer pour la réalisation des mockups de la plateforme derecherche.
Estelle Comment et 2 autres personnes recommandent Amelie
Issue d'un cursus plutôt académique (PhD, data, machine learning, network analysis), elle a su monter en compétence rapidement sur les technologies que nous utilisions, aussi bien backend (Scala) que frontend (React). Aujourd'hui, je pense qu'Amélie a un profil polyvalent, qui lui permet d'être efficace sur de nombreux projets (back, front, data, ML, NLP, algo...).
- DoctoratUniversité Pierre et Marie Curie - France2011Sujet: Méthodes automatiques pour la classification et la prédiction des pannes de réseaux
- Neural Networks and Deep LearningDeepLearning.AI2017
- Functional Programming Principles in ScalaÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE2013