À propos de Sidi
Anglais
Bilingue ou natif
Français
Bilingue ou natif
Expériences
- Sanofi AcceleratorSanofi - Data & AI EngineerINDUSTRIE PHARMACEUTIQUEavril 2026 - Aujourd'hui (2 mois)Paris, FranceContexte :Plateforme GenAI pour la génération automatisée de documents réglementaires (Clinical Trial Documents) dans l'industrie pharmaceutique. Environnement de production critique avec exigences strictes de traçabilité, sécurité et conformité.Réalisations :Conception et développement de l'architecture RAG end-to-end : parsing de documents, chunking, embedding, vector store (Pinecone, S3 Vectors), retrieval et génération LLMIntégration de modèles LLM en production : Azure OpenAI (GPT-4o), AWS Bedrock (Claude)Architecture d'observabilité des pipelines LLM avec Weave/W&B : tracing step-by-step pour les équipes Data ScienceOptimisation des performances : remplacement FAISS par S3 Vectors pré-calculés, réduction des coûts de ~70%Refactoring de l'architecture backend vers DDD-light : résolution de 12 findings d'auditRédaction de specs techniques (design doc 16 sections) alignant Data Science, Data Engineering et BackendConfiguration multi-environnements (dev/test/prod) avec Pinecone et EventBridgeStack technique :Python 3.12 · FastAPI · AWS (Lambda, Step Functions, ECS, S3, Bedrock) · Azure OpenAI · LangChain · Pinecone · Weave/W&B · Terraform · Docker · GitHub Actions · Snowflake · NestJS · React · TypeScript
- BNP Paribas CIBSenior Data & AI EngineerBANQUE & ASSURANCESmai 2022 - février 2026 (3 ans et 9 mois)Pantin, FranceIntervention sur les projets Data Engineering et IA Générative de l'équipe IT Trade Finance, sur les périmètres AML (Anti-Money Laundering) et Fraud Detection.📊 Projet Data — Pipelines AML & Fraud DetectionDéveloppement de pipelines end-to-end traitant des millions de transactions : ETL, transformation, scoring et génération d'alertes.→ Optimisation Spark (tuning avancé, gestion du data skew)→ Intégration Quantexa pour graphes relationnels et enrichissement contextuel des alertes→ Déploiement cloud privé avec Kubernetes, Skaffold, Kustomize👥 Mise en place et structuration d'une nouvelle équipe Data EngineeringPilotage de la création from scratch d'une équipe data de 7+ personnes : définition des besoins, recrutement, onboarding et montée en compétences.→ Création et scaling d'une équipe offshore en Inde (4 Data Engineers, 1 DevOps, 1 BA, 1 PO)→ Mise en place des standards de développement, patterns architecturaux et bonnes pratiques→ Encadrement technique au quotidien : code reviews, décisions architecturales, mentoring🤖 Projet IA Générative — Plateforme RAG d'assistance documentaireConception et déploiement d'une plateforme conversationnelle permettant d'interroger en langage naturel toute la documentation projet (Confluence, Jira, Elasticsearch, emails).→ Réduction de 90% du temps de recherche d'information pour les équipes→ Pipeline de vectorisation multi-sources, base de données vectorielle, orchestration LLM via LangChain avec prompt engineering et stratégies de retrieval optimisées→ API backend Python/FastAPI, déploiement KubernetesStack : Python, LangChain, LangGraph, FastAPI, Elasticsearch, Vector DB, Scala, Spark, Kafka, Kubernetes, AWS, S3, Quantexa, ELK, RAG
- Bedrock streamingSenior Data engineerPRESSE & MÉDIASjanvier 2022 - mai 2022 (4 mois)Lyon, FranceMission freelance au sein de l'équipe A/B Testing, sur les plateformes de streaming M6+, RTL+ Hungary et Videoland.📊 Pipelines Data multi-plateformesConception et développement de pipelines temps réel et batch pour l'expérimentation et l'analytics sur plusieurs plateformes de streaming internationales.→ Ingestion de volumes élevés d'événements utilisateur via AWS Glue, EMR et Athena→ Workflows scalables avec Spark et Databricks pour fiabiliser les métriques d'expérimentation→ Automatisation de l'infrastructure via Terraform et pipelines CI/CD (Jenkins, GitHub Actions)Stack : AWS (Glue, EMR, Athena), Terraform, Python, Scala, Spark, Databricks, Airflow, Docker, Jenkins, GitHub Actions, Iceberg, dbt
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Master informatiqueSorbonne université (ex Université Pierre et Marie Curie)2018
Certifications
- Machine learningStanford University - Coursera2018
- Hadoop Platform and Application FrameworkUniversité San Diego - Coursera2018