You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Souleymane F.SF

Souleymane F.

Data Engineer

300 €/jour
Nantes, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Souleymane

Data Engineer spécialisé dans la conception, l’industrialisation et la fiabilisation de plateformes data en production sur GCP.

J’interviens sur des environnements data complexes pour construire et optimiser des pipelines fiables et scalables (ETL / ELT), depuis l’ingestion jusqu’à l’exposition des données.

Mon travail se concentre sur les problématiques critiques des équipes data :
  • fiabilité et monitoring des pipelines
  • performance des traitements
  • structuration de données pour usage analytique
  • industrialisation des workflows data

🔧 Data Engineering & Platforms
Python | SQL | Airflow | dbt | Spark | BigQuery | GCP

☁️ Cloud & Data Platforms
GCP (BigQuery, Cloud Storage, Dataproc), orchestration Airflow, transformations dbt, processing Spark/PySpark

📊 Objectif
Construire des systèmes data robustes, maintenables et exploitables en production pour les équipes data et métiers.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Nantes (jusqu’à 50 km), Brest (jusqu’à 50 km), Rennes (jusqu’à 50 km), Bordeaux (jusqu’à 50 km), Paris (jusqu’à 50 km)

Expériences

  • Data For Good – BioLit / Planète Mer
    Data Engineer – Data Pipelines & Platform (Python / GCP / ML)
    ASSOCIATIF ET SYNDICAL
    février 2026 - Aujourd'hui (4 mois)
    Nantes, France
    Projet Data / ML autour du traitement et de l’analyse d’images dans le cadre d’un projet environnemental.

    🔧 Responsabilités clés :
    • Conception et optimisation de pipelines ETL pour le traitement automatisé d’images
    • Mise en place de traitements incrémentaux afin de réduire les temps de retraitement et optimiser les performances
    • Intégration de modèles de computer vision dans des pipelines industrialisés
    • Orchestration des flux entre API, stockage objet (S3 / MinIO), PostgreSQL et Label Studio
    • Amélioration de la robustesse, de la maintenabilité et de la scalabilité des traitements
    • Participation à la structuration de workflows Data / ML pour faciliter l’exploitation des données annotées
    🎯 Impact :
    • Réduction significative des temps de traitement
    • Amélioration de la robustesse et stabilité des pipelines
    • Contribution à une plateforme data à impact environnemental
    Python AWS S3 Label Studio REST APIs PostgresSQL
  • IMT ATLANTIQUE
    Data Engineer –Data Platform & KPI Engineering (Python / SQL / Power BI)
    SECTEUR PUBLIC & COLLECTIVITÉS
    septembre 2025 - janvier 2026 (4 mois)
    Nantes, France
    Automatisation d’un pipeline décisionnel destiné au suivi d’indicateurs analytiques pour un réseau de 162 écoles d’ingénieurs.
    Le projet visait à centraliser, transformer et exposer les données nécessaires au pilotage de 4 indicateurs stratégiques de suivi, chacun composé de plusieurs sous-catégories analytiques.

    🔧 Responsabilités clés :
    • Conception d’un pipeline automatisé pour la collecte, la transformation et l’exposition des données analytiques
    • Développement de traitements ETL et orchestration des workflows via Airflow
    • Structuration et fiabilisation des données pour produire des datasets exploitables par les équipes métier
    • Mise à disposition des données via API REST et tableaux de bord décisionnels
    • Formalisation des règles de gestion et documentation des flux de données
    • Participation au cadrage des besoins fonctionnels et à la validation des indicateurs de pilotage
    🎯 Impact :
    • Automatisation et centralisation des flux de données analytiques
    • Amélioration de la disponibilité et de la fiabilité des indicateurs utilisés pour le pilotage
    • Réduction des opérations manuelles liées à la consolidation des données
    Python Modélisation des données PowerBI Power BI DAX DBT
  • bureau d’études géologiques
    Data Engineer – GCP Data Platform (Python / Spark / BigQuery)
    BTP & CONSTRUCTION
    mars 2025 - août 2025 (5 mois)
    Nantes, France
    Conception et optimisation d’une plateforme data cloud sur GCP pour le traitement et l’exploitation de données géospatiales..

    🔧 Responsabilités clés :
    • Développement d’un pipeline Big Data sur Google Cloud Platform pour le traitement de données géolocalisées
    • Mise en place de flux d’ingestion batch vers Cloud Storage
    • Développement et optimisation de traitements Spark / PySpark sur Dataproc
    • Structuration et chargement des données analytiques dans BigQuery
    • Optimisation des performances et de la scalabilité des traitements distribués
    • Mise à disposition d’indicateurs via Looker Studio
    🎯 Impact :
    • Centralisation des données dans une plateforme unifiée
    • Amélioration des performances de traitement
    • Données prêtes à l’exploitation métier et analytique
    Google Cloud Storage Dataproc BigQuery Google Cloud Composer Pyhton

Recommandations

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master 2 Econométrie et statistique appliquée
    Institut d'Administration des Entreprises, IAE de Nantes
    2023
    Master 2 Econométrie et statistique appliquée
  • Ingenieur Statistique et Démographie
    Institut National Des Statistiques et Economies Appliquées
    2022
    Ingenieur Statistique et Démographie

Certifications

Compétences

Catégories