You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Aimad GuallalAG

Aimad Guallal

Data Engineer | Spécialiste Big Data, ETL , IA

445 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Aimad

Spécialisé dans la gestion et l’exploitation des données, j’ai acquis une expertise approfondie en Data Engineering , Machine Learning et traitement de données à grande échelle. Avec plus de trois ans d’expérience, j’ai conçu et déployé des architectures data robustes, optimisé des pipelines ETL et mis en place des solutions scalables et automatisées pour divers secteurs.

Que ce soit pour structurer vos données, améliorer leur qualité ou optimiser vos traitements, transformer vos données en véritable atout stratégique, je vous accompagne avec des solutions adaptées et performantes. Discutons de vos projets !
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • Ynsect
    Data Engineer
    avril 2023 - juin 2025 (2 ans et 2 mois)
    Paris, France
    Mise en place d’une plateforme de données robuste pour centraliser et automatiser la collecte, l’intégration et le traitement des données.
    • Collaboration étroite avec les équipes opérationnelles pour définir et structurer les besoins en données, facilitant leur traitement et leur exploitation.
    • Travail permanent avec l’équipe IT pour concevoir et maintenir une architecture de plateforme de données évolutive, sécurisée et scalable.
    • Encadrement et mentorat des stagiaires sur des projets liés à la plateforme de données, garantissant le respect des délais et la qualité des livrables.
    • Conception et implémentation d’un entrepôt de données avec ClickHouse, optimisant le stockage et l’efficacité des requêtes sur les données traitées.
    • Exploitation du calcul distribué avec Spark pour accélérer le traitement et l’analyse de grands volumes de données, améliorant ainsi les performances globales.
    • Développement et optimisation de pipelines ETL assurant un transfert fluide des données entre les systèmes industriels (ERP Sage X3, MES, WCS) et le Data Lake S3.
    • Mise en place d’un moteur d’indexation pour une bonne gouvernance de données.
    • Gestion de l’ingestion, de la transformation et de la gouvernance des données en utilisant Linux, Python, Pandas, SQL et Spark.
    • Automatisation des workflows avec Airflow afin d’assurer la qualité et la cohérence des données.
    Réalisations :
    • Gestion des données la plus grande ferme d’élevage d’insectes au monde (46 000 m², 36 mètres de hauteur), avec un flux de 10M de points de données par jour.
    • Réduction de l’espace de stockage de 30 To de données avec un taux de compression de 1/3, en combinant S3, la compression Parquet et le stockage colonne de ClickHouse.
    • Mise à disposition d’un accès rapide aux données via Power BI, avec des tableaux de bord mis à jour pour plus de 100 utilisateurs de différents départements.
    Outils: Python, Spark, SQL, Pandas, QlickHouse, SGBD, Boto3, AWS, Airflow, Meilisearch, Linux, Nginx, PowerBI
    Spark Python AWS SQL PowerBI
  • Reezocar Groupe Société Générale
    ML Engineer
    E-COMMERCE
    avril 2022 - août 2022 (4 mois)
    Paris, France
    Conception et implémentation d’un système automatisé permettant de modifier dynamiquement l’arrière-plan des images de voitures grâce à des modèles de Deep Learning.
    • Automatisation de l’ingestion, du traitement et du remplacement d’arrière-plan des images stockées sur S3 via une API Flask.
    • Conteneurisation des composants de l’API avec Docker, garantissant la portabilité et l’évolutivité de la solution.
    • Déploiement de la solution sur AWS (S3, EC2), permettant un accès rapide et efficace aux fonctionnalités via le cloud.
    Réalisations:
    • Optimisation du traitement des images pour le site e-commerce Reezocar, améliorant ainsi la rapidité et l’efficacité du processus.
    Outils: Python, Pytorch, OpenCV, Flask, Docker, AWS S3, AWS Glue, EC2
  • Telemedecine Technologies
    Data & Software Engineer
    SECTEUR MÉDICAL
    septembre 2021 - mars 2022 (6 mois)
    Paris, France
    Conception et implémentation d’un système de mise en correspondance permettant de dédupliquer et rationaliser les entrées liées à un même sujet, améliorant ainsi la qualité des données de la plateforme CleanWEB.
    • Développement de flux de données pour le prétraitement et l’enrichissement des entrées utilisateur à l’aide de techniques de NLP telles que la tokenisation, la suppression des stopwords, l’extraction de caractéristiques et le calcul de similarité.
    • Intégration de la solution en tant que système de classement, permettant de suggérer les options les plus pertinentes aux utilisateurs.
    • Déploiement de la solution sous forme d’API, facilitant son intégration transparente dans la plateforme CleanWEB.
    Réalisations :
    • Réduction significative du temps de recherche d’informations pertinentes dans le moteur de recherche par requêtes de CleanWEB.

    Outils : Python, Spark, Pandas, Numpy, Flask, Docker, RegEx, NLTK, SpaCy

Recommandations

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Diplôme d'ingénieur Généraliste Centralien
    CentraleSupélec et Centrale Casablanca
    2022
    Diplôme d'ingénieur Généraliste Centralien
  • Classes Préparatoires aux Grandes Ecoles (CPGE)
    Lycée d'Excellence Benguirir (LYDEX),
    2019
    Classes Préparatoires aux Grandes Ecoles (CPGE)

Compétences

Catégories