À propos de Soufiane
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- Société GénéraleData EngineerBANQUE & ASSURANCESseptembre 2023 - Aujourd'hui (2 ans et 9 mois)La Défense, FranceDans le cadre de cette mission longue durée, j'interviens en tant que Data Engineer en environnement de production à grande échelle.Réalisations clés :→ Optimisation de l'infrastructure data ayant généré plusieurs centaines de milliers d'euros d'économies grâce à la refonte de pipelines Spark sous-performants et la réduction significative des temps de traitement et des coûts de compute.→ Conception et développement de pipelines de données scalables (ETL/ELT) sur Palantir Foundry, assurant fiabilité et maintenabilité en production.→ Optimisation de workflows Big Data sous Apache Spark et Python : réduction des temps d'exécution, amélioration de la gestion mémoire et partitionnement des données.→ Mise en place de processus d'automatisation du contrôle qualité des données, réduisant les interventions manuelles et les erreurs en production.→ Collaboration étroite avec les équipes Data Science pour la fourniture de datasets fiables, documentés et réutilisables, accélérant la mise en production des modèles ML.→ Contribution à l'architecture data globale dans une logique de scalabilité, performance et réduction des coûts d'infrastructure.Environnement technique : Palantir Foundry, Apache Spark, Python, SQL, ETL/ELT, Big Data, MLOps, Data Quality, Pipeline Orchestration.
- Societe GeneraleData ScientistBANQUE & ASSURANCESmars 2023 - septembre 2023 (6 mois)Paris, FranceDans le cadre de mon stage de fin d'études (Master Data Science), j'ai travaillé sur un projet de génération de données synthétiques, une problématique au croisement de la data science, de la confidentialité des données et de la qualité des datasets.Réalisations clés :→ Conception et développement d'un moteur de génération de données synthétiques capable de reproduire les distributions statistiques de données réelles tout en garantissant la confidentialité et la sécurité des données sensibles.→ Application de techniques avancées de Machine Learning et de modélisation statistique pour générer des datasets artificiels réalistes, utilisables pour les phases de test et d'analyse sans exposition de données personnelles.→ Mise en place d'un framework d'évaluation de la qualité des données synthétiques : mesure de similarité, métriques de fidélité statistique et tests d'utilisabilité pour garantir la fiabilité des datasets générés.→ Intégration du pipeline de génération dans l'environnement de test interne de l'entreprise, avec documentation technique complète facilitant la prise en main par les équipes.Impact : Réduction de la dépendance aux données réelles pour les phases de test, accélération des cycles de développement et conformité renforcée avec les exigences RGPD / Privacy by Design.Environnement technique : Python, Airfow, Jenkins, Docker, Git, Machine Learning, Statistical Modeling, Synthetic Data Generation, Data Privacy, Data Quality, RGPD, Pandas, Scikit-learn.
Recommandations
Soyez le premier à recommander Soufiane
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Double diplôme MSIAM Data scienceENSIMAG2023
- IngénieurENSIMAG - Grenoble INP2023
Certifications
- Certified Palantir Foundry Data Engineer ProfessionalPalantir2025
- Databricks Certified Data Engineer AssociateDatabricks2026