Description

Data Scientist/ Data Engineer avec un profil hybride confirmé, j'interviens sur l’ensemble du cycle de vie de la donnée, de l’ingestion à la valorisation et l’industrialisation de solutions Data. J’interviens sur des projets de modernisation des plateformes data dans des environnements Azure / Databricks, GCP. Expérience dans la conception et l’industrialisation de pipelines de données, le traitement de volumes importants via Spark (PySpark / SQL) et la structuration des données dans des architectures Lakehouse. Compétences en modélisation de données, intégration de sources SQL Server, et préparation de datasets analytiques pour la restitution dans Power BI. Impliqué dans les démarches de gouvernance des données via Data Galaxy. Habitué à évoluer dans des équipes Agile Scrum, en interaction avec les équipes Data, BI et métiers.

Compétences clés :

📊 Data Science & Data Engineering

- Développement, déploiement et supervision de pipelines de données (API, Scraping, ETL, ELT)

- Analyse et visualisation des données ( DataBricks, Power BI)

- Modélisation prédictive et Machine Learning (supervisé, non supervisé)

⚙️ Automatisation & Optimisation

- APIs (REST)

- ETL, ELT (DataBricks, Azure Datafactory, Airflow)

- Outils low-code (n8n)

- Cloud (GCP : GCS, BigQuery, Cloud Composer (Airflow), Vertex AI, kubeflow)

- Pipelines CI/CD : Azure DevOps, Cloud Build/Cloud Run

🛠 Outils & Technologies

- Cloud & Industrialisation : Azure, GCP, Docker, Flask API, Kubernetes, Git (CI/CD pipelines)

- Déploiement de modèles en production et monitoring : Azure DevOps, Docker, Kubernetes, MLFlow

- Programmation : Databricks, Python, R, SAS

- Base de données : SQL, PostgreSQL, SQL Server

- Cloud : Azure, GCP

- DevOps : Docker, Kubernetes, CI/CD, GitHub Actions, GitLab CI

- Orchestration de workflow : Azure Data Factory, Databricks workflows, Airflow

- Visualisation de données : Power BI, Streamlit, R Shiny

📩 Contactez-moi pour échanger sur votre projet !

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète

Préférences en matière de lieu de travail

Accepte de travailler sur site

Nantes (jusqu’à 50 km), Paris (jusqu’à 50 km), Rennes (jusqu’à 50 km), Strasbourg (jusqu’à 50 km), Lyon (jusqu’à 50 km)

SNCF
Data Scientist / Data Engineer
TRANSPORTS
octobre 2025 - Aujourd'hui (8 mois)
Nantes, France
Contexte : Mise en oeuvre et supervision d’une Data plateforme scalable au sein d’une équipe agile au profit
de divers projets.

Réalisations :

✅ Développement, déploiement et supervision de pipelines de données via Azure Databricks, Azure Data Factory (ADF), Azure DevOps
✅ Production d'insights (KPI) métier sur Power BI pour le suivi pilotage d'activité
✅ Gouvernance de données via Unity Catalog, Data Galaxy
✅ Environnements : Databricks, Spark, Azure, Power BI, DataGalaxy, Confluence, Jira, environnement agile scrum
Databricks Microsoft Azure Scrum Microsoft Power BI Spark
ORS - PACA
Data Scientist / Data Engineer
SANTÉ & BIEN-ÊTRE
février 2024 - août 2025 (1 an et 6 mois)
Marseille, France
Contexte : Gestion et structuration de données au profit de différents projets
Missions :
✅ Mise en oeuvre de traitements pour structurer, standardiser des données
✅ Implémentation des techniques de clustering pour des use-cases métier
✅ Construction d'indicateurs clefs pour vulgariser les résultat.

✅ Environnements : Python, SQL, Oracle,Machine Learning, Données massives
SQL SNDS Dashboards Oracle Database Machine learning
Inserm INSERM / APHP
Data Scientist / Data Engineer
SANTÉ & BIEN-ÊTRE
juin 2023 - décembre 2023 (6 mois)
Paris, France
Contexte : Étude rétrospective multicentrique afin dévaluer l’impact de la COVID-19 sur la chirurgie digestive
urgente
Missions :
✅ Exploitation de données massives issues de 39 hôpitaux (EDS-APHP)
✅ Implémentation de méthodes statistiques et de Machine Learning
de mortalité des patients ayant subi une chirurgie digestive.
✅ Vulgarisation des résultats via la coécriture d’un article scientifique
✅ Environnements : Python, R, Spark, PostegreSQL, EDS, Machine Learning, Données massives
Python Spark PostgreSQL Machine learning Programmation Python

Consulter toutes les expériences de Saïba

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Ingénieur Data
ENSAI
2023
ENSAI Ingénieur Data
Ingénieur Statisticien
ENSAE-Dakar
2021
Ingénieur Statisticien

Azure Databricks & Spark For Data Engineers
Udemy
2026
Azure Data Factory Azure Databricks Microsoft Azure Databricks
Google Cloud Platform (GCP) for Data Engineers
Udemy
https://www.udemy.com/course/elt-bigquery-gcp/
Google Cloud Platform (GCP) BigQuery Data Pipelines Programmation Python Cloud Composer GCS ETL ELT SQL

Les certifications de Saïba sont accessibles uniquement aux membres Malt

Développeur Web Back-end

Saïba Sawadogo

Data Scientist| Engineer | Databricks| Azure| GCP

À propos de Saïba

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories