Description

Data Scientist & ML Engineer avec plus de 9 ans d'expérience, je combine expertise en data science machine learning avancé et technologies d'IA générative (RAG, LLMs) pour créer des solutions à forte valeur ajoutée. Mon expertise technique couvre l'ensemble de la chaîne de valeur data - du développement de pipelines robustes sur AWS à l'implémentation de systèmes conversationnels intelligents, en passant par le déploiement de modèles ML en production. Maîtrisant les écosystèmes Python, SQL, Spark et les frameworks modernes (LangChain, Langraph, FastAPI), j'applique les meilleures pratiques MLOps et d'ingénierie logicielle pour garantir qualité et évolutivité. Ma capacité à traduire les besoins métiers en solutions techniques innovantes, associée à une veille technologique constante, me permet d'apporter une valeur stratégique aux projets data-driven.

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

BPCE
ML Engineer
BANQUE & ASSURANCES
octobre 2025 - Aujourd'hui (8 mois)
Paris, France
Conception et développement d’un pipeline RAG de bout en bout permettant
d’interroger en langage naturel une base documentaire volumineuse et hétérogène (PDF, Word). Le système repose sur une architecture hiérarchique d’indexation et un retrieval hybride dense+sparse pour maximiser la précision des réponses générées, dans un environnement bancaire on-premise garantissant la souveraineté des données.
Python RAG LangGraph Github Actions Prompt engineering
JAAG
ML Engineer / AI Dev
CONSEIL & AUDIT
mars 2025 - Aujourd'hui (1 an et 3 mois)
Paris, France
Contexte :
Conception et développement d'une solution complète d'automatisation du traitement de factures pour PME et cabinets comptables, utilisant l'intelligence artificielle locale (Mistral via Ollama) et l'OCR avancé pour transformer des documentsPDF en données structurées exploitables. La plateforme garantit une confidentialité totale avec un traitement 100% local, réduisant de 90% le temps de traitement (20 min → 2 min par facture) avec une précision >95% sur documents standards.

Réalisations :
• Conception d'une architecture modulaire avec séparation claire des responsabilités (extraction, traitement IA, stockage)
• développement de modèles de données flexibles avec Pydantic pour validation et métadonnées complètes.
• Implémentation de pipelines d'extraction dual (PyPDF2 pour PDFs numériques, Tesseract OCR pour documents scannés) avec détection automatique du type de document et routage intelligent vers la méthode optimale.
• Configuration et intégration d'Ollama/Mistral pour traitement local des documents, développement de stratégies de parsing JSON avec fallbacks pour garantir extraction même avec réponses LLM malformées.
• Design et implémentation d'une couche de stockage PostgreSQL avec indexation optimisée pour JSON, système de recherche multi-critères (date, montant, type, contenu) et fonctionnalités d'export Excel/JSON personnalisées.
• Développement d'une interface de démonstration Streamlit avec visualiseur JSON pour valider les concepts UX/UI et fournir les spécifications détaillées au dev front-end pour l'implémentation production.
• Rédaction de la documentation détaillée du projet.
Environnement technique : Python, Streamlit, PostgreSQL, Ollama, Mistral, Tesseract OCR, PyPDF2, Pydantic, Pandas, NumPy, FastAPI, Git, Shell scripting, SQL, JSON Processing, Logging.
Python LLM OCR FastAPI JSON
Disneyland Paris
ML Engineer / AI Developer
DIVERTISSEMENTS & LOISIRS
février 2024 - février 2025 (1 an)
Paris, France
Projet: Développement et mise en production d'un algorithme de recommendation

Contexte :
• Système de recommandation personnalisée : Développement et déploiement d'un moteur de recommandation personnalisé pour Disneyland Paris, utilisant l'analyse prédictive et le machine learning pour suggérer des hôtels adaptés aux préférences des visiteurs. Le système exploite les données clients enrichies et une architecture cloud pour optimiser les conversions et l'expérience utilisateur.
• Assistant documentaire intelligent (RAG) : Conception d'un système conversationnel permetant aux équipes internes d'interroger naturellement la documentation technique des applications développées par Disney, en utilisant les technologies de RAG et LLM pour transformer des milliers de pages de documentation en un assistant virtuel capable de répondre précisément aux questions techniques, accélérant ainsi la résolution de problèmes.

Réalisations:
◦ Collaboration avec les Product Owners pour définir les objectifs et évaluation des modèles existants avec Python et SageMaker
◦ Développement de pipelines d'extraction depuis Snowflake et évaluation comparative d'algorithmes ML/DL (Scikit-learn, TensorFlow, PyTorch).
◦ Création d'API en Python pour exposer les fonctionnalités de recommandation sur le site web de Disneyland Paris.
◦ Déploiement cloud : Orchestration du système avec Docker sur AWS (SageMaker, ECS, S3, EC2).
◦ Ingestion documentaire pour RAG : Implémentation d'un système d'extraction via AWS Glue pour traiter la documentation technique de l'ensemble du portefeuille d'applications Disney.
◦ Vectorisation : Développement de la couche de vectorisation sémantique avec SageMaker et LlamaIndex, et indexation avec OpenSearch pour recherches précises.
◦ Configuration du pipeline RAG avec Claude 3.5 Sonnet sur Amazon Bedrock, incluant l'ingénierie de prompts et la gestion contextuelle.
◦ Rédaction de la documentation technique.
Python Amazon Web Services Machine learning Generative AI Docker

Consulter toutes les expériences de Tarik

Soyez le premier à recommander Tarik

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Machine Learning Specialisation
Coursera
2022
Machine Learning Specialisation
Diplôme d'Ingénieur d'Etat en Recherche Opérationnelle et Aide à la Décision
Institut National de Statistique et d'Économie Appliquée
2016
Diplôme d'Ingénieur d'Etat en Recherche Opérationnelle et Aide à la Décision

Consultez la formation qu'a suivie Tarik

Tarik O.

ML Engineer / Data Scientist

À propos de Tarik

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Compétences

Catégories