You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Darius G.DG

Darius G.

ML Engineer

520 €/jour
Lille, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Darius

Portfolio: dariusgros.dev
Site: ourkat-technologies.fr
Ressources et blog: ourkat-technologies.fr/blog

Ingénieur ML/Data avec 5 ans d'expérience, dont une forte composante MLOps : industrialisation de pipelines, CI/CD,
versioning, reproductibilité et déploiement de modèles sous contraintes (RGPD, données sensibles, infrastructure
souveraine). Habitué à analyser des modèles existants pour identifier des axes d'amélioration (performance, fiabilité,
coûts) et à intégrer des modèles HuggingFace dans des produits réels via Docker. Maîtrise solide de Python, des
pipelines de données à grande échelle (Spark, Delta Lake, Airflow) et des bonnes pratiques d'ingénierie logicielle
(architecture hexagonale, TDD, SOLID). Autonome, curieux, à l'aise dans des équipes techniques resserrées. Si seul sur projet, je peux own le produit fullstack (back, ml/dl et front).

Compétences clés
Machine Learning & Deep Learning : Python, PyTorch, scikit-learn, classification, régression, cluster-
ing, feature engineering, augmentation de données, cross-validation, optimisation de seuil, fonctions de perte,
prévision, tests A/B.

IA / LLM / NLP : Fine-tuning (CamemBERT, QLoRA), transfer learning, RAG, LangGraph, LangChain,
prompt engineering, embeddings, pgvector, ChromaDB, Claude API, Ollama, HuggingFace Transformers, analyse de sentiment, classification de texte

MLOps & Expérimentation : MLflow, suivi d’expériences, versioning de modèles, feedback loops, entraîne-
ment config-driven, sweep de seuils, prévention du data leakage, reproductibilité, packaging Docker, monitoring

Data Engineering : Apache Spark, Delta Lake, Databricks, Airflow, PostgreSQL, BigQuery, Redshift, pipelines
ETL, modélisation de données

Backend & Infrastructure : FastAPI, Pydantic, API REST, WebSocket, architecture hexagonale, TDD,
SOLID, Docker, Traefik, MFA/OTP, conformité RGPD

Cloud & DevOps : AWS, GCP, GitHub Actions, CI/CD, déploiement VPS

Languages : Python, SQL, Scala, R
  • Anglais

    Bilingue ou natif

  • Français

    Bilingue ou natif

Accepte de travailler sur site
Lille (jusqu’à 10 km), Nantes (jusqu’à 10 km), Paris (jusqu’à 10 km)

Expériences

  • Ourkat Technologies
    Ingénieur ML / IA (Freelance), Ourkat Technologies
    CONSEIL & AUDIT
    février 2026 - Aujourd'hui (4 mois)
    Lille, France
    Systèmes IA de bout en bout pour PME. 3 projets ML + 2 sites web livrés.

    • Conception d’un pipeline ML complet : ingestion, segmentation documentaire, embeddings, recherche par similarité avec pgvector, évaluation et génération. Orchestration LangGraph en architecture hexagonale.
    • Système RAG hybride (BM25 + recherche de proximité pgvector) pour citation automatique de sources dans les rapports générés. Architecture deux couches : squelette de rapport généré par code + module de rédaction IA optionnel activé après validation métier.
    • Industrialisation avec packaging Docker, intégration FastAPI, PostgreSQL, déploiement sur infrastructure souveraine et CI/CD.
    • MLOps : observabilité avec Langfuse, fine-tuning QLoRA, optimisation des coûts d’inférence et de la latence API.
    → Pipeline RAG pour citation automatique de documents techniques. Rédaction IA conditionnelle avec validation métier.
    Langchain RAG LangFuse NLP PostgreSQL
  • Ourkat Technologies
    Co-fondateur & Lead ML/Backend — Korus
    CINÉMA & AUDIOVISUEL
    janvier 2026 - mai 2026 (4 mois)
    Lille, France
    • Fine-tuning DistilCamemBERT pour classification binaire de contenu toxique (recall > 0.95). 6 catégories
    de détection, seuil optimisé à 0.3, weighted CrossEntropyLoss.
    • Pipeline de génération de données multi-source : données synthétiques Ollama, web scraping, augmentation
    adversariale (leetspeak, unicode confusables, zero-width chars). Split train/test/val avant augmentation.
    Zéro data leakage.
    • Framework d’expérimentation config-driven (YAML + MLflow), versioning de modèles avec rollback. Feed-
    back loop production : faux négatifs signalés par opérateur réintégrés au training.
    • Backend temps réel avec FastAPI, WebSocket et PostgreSQL, déployé sur VPS souverain UE, conforme
    RGPD, sans dépendance cloud US.
    → Modèle fine-tuné en production. Pipeline de modération 3 couches dimensionné pour 100 à 5 000 participants.
    Docker Python Management CI/CD GitHub NLP
  • Client PME confidentiel
    Consultant IA, Automatisation documentaire
    ENERGIE
    décembre 2025 - février 2026 (2 mois)
    Paris, France
    • Déploiement d’un système hybride parsing + LLM pour conversion automatique de rapports PDF techniques
    (géotechnique, multi-fournisseurs) en JSON/Excel structurés. Prompts modulaires de 300+ lignes avec
    validation par contraintes physiques du domaine.
    • Optimisation tokens : extraction text-based via pdfplumber (pas de vision API), traitement page par page.
    Stratégie de rejet conservateur privilégiant la précision.
    • Infrastructure complète : VPS, Docker, intégration API LLM, authentification MFA/OTP, conformité
    RGPD. Interface Gradio adoptée au quotidien par les équipes métiers.
    → Traitement manuel intégralement automatisé. ~30 % d’économies sur les coûts API LLM.
    Docker Intégration d’une API externe Airflow IA et analyse de données Python

Recommandations

Soyez le premier à recommander Darius

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master MIASHS Machine Learning
    Université de Lille
    2022
    Relevant coursework: Time Series Forecasting, Advanced ML Algorithms, Mathematical Optimization, Cloud Computing
  • Bachelor In Applied Mathematics & Minor in Economics
    Wingate University
    2020
    Relevant coursework: Data Analysis, Advanced Statistics, Econometrics, Economic Forecasting Models

Compétences

Catégories