You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Saïba SawadogoSS

Saïba Sawadogo

Data Scientist| Engineer | Databricks| Azure| GCP

400 €/jour
Nantes, FR
3-7 ans

Délai de réponse moyen : 12h

À propos de Saïba

Data Scientist/ Data Engineer avec un profil hybride confirmé, j'interviens sur l’ensemble du cycle de vie de la donnée, de l’ingestion à la valorisation et l’industrialisation de solutions Data. J’interviens sur des projets de modernisation des plateformes data dans des environnements Azure / Databricks, GCP. Expérience dans la conception et l’industrialisation de pipelines de données, le traitement de volumes importants via Spark (PySpark / SQL) et la structuration des données dans des architectures Lakehouse. Compétences en modélisation de données, intégration de sources SQL Server, et préparation de datasets analytiques pour la restitution dans Power BI. Impliqué dans les démarches de gouvernance des données via Data Galaxy. Habitué à évoluer dans des équipes Agile Scrum, en interaction avec les équipes Data, BI et métiers.

Compétences clés :

📊 Data Science & Data Engineering

- Développement, déploiement et supervision de pipelines de données (API, Scraping, ETL, ELT)
- Analyse et visualisation des données ( DataBricks, Power BI)
- Modélisation prédictive et Machine Learning (supervisé, non supervisé)

⚙️ Automatisation & Optimisation

- APIs (REST)
- ETL, ELT (DataBricks, Azure Datafactory, Airflow)
- Outils low-code (n8n)
- Cloud (GCP : GCS, BigQuery, Cloud Composer (Airflow), Vertex AI, kubeflow)
- Pipelines CI/CD : Azure DevOps, Cloud Build/Cloud Run

🛠 Outils & Technologies

- Cloud & Industrialisation : Azure, GCP, Docker, Flask API, Kubernetes, Git (CI/CD pipelines)
- Déploiement de modèles en production et monitoring : Azure DevOps, Docker, Kubernetes, MLFlow
- Programmation : Databricks, Python, R, SAS
- Base de données : SQL, PostgreSQL, SQL Server
- Cloud : Azure, GCP
- DevOps : Docker, Kubernetes, CI/CD, GitHub Actions, GitLab CI
- Orchestration de workflow : Azure Data Factory, Databricks workflows, Airflow
- Visualisation de données : Power BI, Streamlit, R Shiny
📩 Contactez-moi pour échanger sur votre projet !
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Nantes (jusqu’à 50 km), Paris (jusqu’à 50 km), Rennes (jusqu’à 50 km), Strasbourg (jusqu’à 50 km), Lyon (jusqu’à 50 km)

Expériences

  • SNCF
    Data Scientist / Data Engineer
    TRANSPORTS
    octobre 2025 - Aujourd'hui (8 mois)
    Nantes, France
    Contexte : Mise en oeuvre et supervision d’une Data plateforme scalable au sein d’une équipe agile au profit
    de divers projets.

    Réalisations :

    ✅ Développement, déploiement et supervision de pipelines de données via Azure Databricks, Azure Data Factory (ADF), Azure DevOps
    ✅ Production d'insights (KPI) métier sur Power BI pour le suivi pilotage d'activité
    ✅ Gouvernance de données via Unity Catalog, Data Galaxy
    ✅ Environnements : Databricks, Spark, Azure, Power BI, DataGalaxy, Confluence, Jira, environnement agile scrum
    Databricks Microsoft Azure Scrum Microsoft Power BI Spark
  • ORS - PACA
    Data Scientist / Data Engineer
    SANTÉ & BIEN-ÊTRE
    février 2024 - août 2025 (1 an et 6 mois)
    Marseille, France
    Contexte : Gestion et structuration de données au profit de différents projets
    Missions :
    ✅ Mise en oeuvre de traitements pour structurer, standardiser des données
    ✅ Implémentation des techniques de clustering pour des use-cases métier
    ✅ Construction d'indicateurs clefs pour vulgariser les résultat.

    ✅ Environnements : Python, SQL, Oracle,Machine Learning, Données massives
    SQL SNDS Dashboards Oracle Database Machine learning
  • Inserm INSERM / APHP
    Data Scientist / Data Engineer
    SANTÉ & BIEN-ÊTRE
    juin 2023 - décembre 2023 (6 mois)
    Paris, France
    Contexte : Étude rétrospective multicentrique afin dévaluer l’impact de la COVID-19 sur la chirurgie digestive
    urgente
    Missions :
    ✅ Exploitation de données massives issues de 39 hôpitaux (EDS-APHP)
    ✅ Implémentation de méthodes statistiques et de Machine Learning
    de mortalité des patients ayant subi une chirurgie digestive.
    ✅ Vulgarisation des résultats via la coécriture d’un article scientifique
    ✅ Environnements : Python, R, Spark, PostegreSQL, EDS, Machine Learning, Données massives
    Python Spark PostgreSQL Machine learning Programmation Python

Recommandations

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Ingénieur Data
    ENSAI
    2023
    ENSAI Ingénieur Data
  • Ingénieur Statisticien
    ENSAE-Dakar
    2021
    Ingénieur Statisticien

Certifications

  • Azure Databricks & Spark For Data Engineers
    Udemy
    2026
    Azure Data Factory Azure Databricks Microsoft Azure Databricks
  • Google Cloud Platform (GCP) for Data Engineers
    Udemy
    https://www.udemy.com/course/elt-bigquery-gcp/
    Google Cloud Platform (GCP) BigQuery Data Pipelines Programmation Python Cloud Composer GCS ETL ELT SQL

Compétences

Catégories