You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Tarik O.TO

Tarik O.

ML Engineer / Data Scientist

750 €/jour
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Tarik

Data Scientist & ML Engineer avec plus de 9 ans d'expérience, je combine expertise en data science machine learning avancé et technologies d'IA générative (RAG, LLMs) pour créer des solutions à forte valeur ajoutée. Mon expertise technique couvre l'ensemble de la chaîne de valeur data - du développement de pipelines robustes sur AWS à l'implémentation de systèmes conversationnels intelligents, en passant par le déploiement de modèles ML en production. Maîtrisant les écosystèmes Python, SQL, Spark et les frameworks modernes (LangChain, Langraph, FastAPI), j'applique les meilleures pratiques MLOps et d'ingénierie logicielle pour garantir qualité et évolutivité. Ma capacité à traduire les besoins métiers en solutions techniques innovantes, associée à une veille technologique constante, me permet d'apporter une valeur stratégique aux projets data-driven.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • BPCE
    ML Engineer
    BANQUE & ASSURANCES
    octobre 2025 - Aujourd'hui (8 mois)
    Paris, France
    Conception et développement d’un pipeline RAG de bout en bout permettant
    d’interroger en langage naturel une base documentaire volumineuse et hétérogène (PDF, Word). Le système repose sur une architecture hiérarchique d’indexation et un retrieval hybride dense+sparse pour maximiser la précision des réponses générées, dans un environnement bancaire on-premise garantissant la souveraineté des données.
    Python RAG LangGraph Github Actions Prompt engineering
  • JAAG
    ML Engineer / AI Dev
    CONSEIL & AUDIT
    mars 2025 - Aujourd'hui (1 an et 3 mois)
    Paris, France
    Contexte :
    Conception et développement d'une solution complète d'automatisation du traitement de factures pour PME et cabinets comptables, utilisant l'intelligence artificielle locale (Mistral via Ollama) et l'OCR avancé pour transformer des documentsPDF en données structurées exploitables. La plateforme garantit une confidentialité totale avec un traitement 100% local, réduisant de 90% le temps de traitement (20 min → 2 min par facture) avec une précision >95% sur documents standards.


    Réalisations :
    • Conception d'une architecture modulaire avec séparation claire des responsabilités (extraction, traitement IA, stockage)
    • développement de modèles de données flexibles avec Pydantic pour validation et métadonnées complètes.
    • Implémentation de pipelines d'extraction dual (PyPDF2 pour PDFs numériques, Tesseract OCR pour documents scannés) avec détection automatique du type de document et routage intelligent vers la méthode optimale.
    • Configuration et intégration d'Ollama/Mistral pour traitement local des documents, développement de stratégies de parsing JSON avec fallbacks pour garantir extraction même avec réponses LLM malformées.
    • Design et implémentation d'une couche de stockage PostgreSQL avec indexation optimisée pour JSON, système de recherche multi-critères (date, montant, type, contenu) et fonctionnalités d'export Excel/JSON personnalisées.
    • Développement d'une interface de démonstration Streamlit avec visualiseur JSON pour valider les concepts UX/UI et fournir les spécifications détaillées au dev front-end pour l'implémentation production.
    • Rédaction de la documentation détaillée du projet.
    Environnement technique : Python, Streamlit, PostgreSQL, Ollama, Mistral, Tesseract OCR, PyPDF2, Pydantic, Pandas, NumPy, FastAPI, Git, Shell scripting, SQL, JSON Processing, Logging.
    Python LLM OCR FastAPI JSON
  • Disneyland Paris
    ML Engineer / AI Developer
    DIVERTISSEMENTS & LOISIRS
    février 2024 - février 2025 (1 an)
    Paris, France
    Projet: Développement et mise en production d'un algorithme de recommendation

    Contexte :
    • Système de recommandation personnalisée : Développement et déploiement d'un moteur de recommandation personnalisé pour Disneyland Paris, utilisant l'analyse prédictive et le machine learning pour suggérer des hôtels adaptés aux préférences des visiteurs. Le système exploite les données clients enrichies et une architecture cloud pour optimiser les conversions et l'expérience utilisateur.
    • Assistant documentaire intelligent (RAG) : Conception d'un système conversationnel permetant aux équipes internes d'interroger naturellement la documentation technique des applications développées par Disney, en utilisant les technologies de RAG et LLM pour transformer des milliers de pages de documentation en un assistant virtuel capable de répondre précisément aux questions techniques, accélérant ainsi la résolution de problèmes.

    Réalisations:
    ◦ Collaboration avec les Product Owners pour définir les objectifs et évaluation des modèles existants avec Python et SageMaker
    ◦ Développement de pipelines d'extraction depuis Snowflake et évaluation comparative d'algorithmes ML/DL (Scikit-learn, TensorFlow, PyTorch).
    ◦ Création d'API en Python pour exposer les fonctionnalités de recommandation sur le site web de Disneyland Paris.
    ◦ Déploiement cloud : Orchestration du système avec Docker sur AWS (SageMaker, ECS, S3, EC2).
    ◦ Ingestion documentaire pour RAG : Implémentation d'un système d'extraction via AWS Glue pour traiter la documentation technique de l'ensemble du portefeuille d'applications Disney.
    ◦ Vectorisation : Développement de la couche de vectorisation sémantique avec SageMaker et LlamaIndex, et indexation avec OpenSearch pour recherches précises.
    ◦ Configuration du pipeline RAG avec Claude 3.5 Sonnet sur Amazon Bedrock, incluant l'ingénierie de prompts et la gestion contextuelle.
    ◦ Rédaction de la documentation technique.
    Python Amazon Web Services Machine learning Generative AI Docker

Recommandations

Soyez le premier à recommander Tarik

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Machine Learning Specialisation
    Coursera
    2022
    Machine Learning Specialisation
  • Diplôme d'Ingénieur d'Etat en Recherche Opérationnelle et Aide à la Décision
    Institut National de Statistique et d'Économie Appliquée
    2016
    Diplôme d'Ingénieur d'Etat en Recherche Opérationnelle et Aide à la Décision

Compétences

Catégories