You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Simon RochwergSR

Simon Rochwerg

Expert Web Scraping & Automatisations complexes

450 €/jour
50 projets
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Simon

🕷️ Scraping web dès 150€ par site -> site difficile, blocage, résolution de captchas.

Je vous aide à transformer n’importe quel site web en flux de données propre, structuré et exploitable (marche aussi depuis les application ios et android ✨)

Avec 10 ans d’expérience et plus de 500 entreprises accompagnées, je conçois des systèmes de scraping robustes et maintenables en production.

Je mets en place des solutions automatiques qui :

✔️ Collectent les données à intervalles réguliers
✔️ Gèrent les erreurs et blocages automatiquement
✔️ Détectent les changements de structure
✔️ Maintiennent la stabilité dans le temps
✔️ Produisent des données propres, normalisées et exploitables
✔️ Exploitable via API

Que ce soit pour générer des leads, surveiller des concurrents, suivre un marché ou nourrir des agents IA, je construis des solutions adaptées à vos objectifs.

🔎 Exemples de projets :

- Google Maps (génération de leads)
- Google Search
- LinkedIn & Sales Navigator
- Indeed (offres d’emploi)
- Immobilier (SeLoger, PAP, Idealista, Leboncoin)
- Réseaux sociaux (Instagram, YouTube, Twitter…)

🛡️ Expertise environnements protégés :

- DataDome
- Cloudflare
- PerimeterX / HUMAN
- reCAPTCHA, hCaptcha, Geetest
- Captchas complexes & détection comportementale, fingerprinting

⚙️ Méthodologie production :

- Architecture scalable
- Rotation IP intelligente
- Gestion d’empreinte navigateur
- Monitoring & alerting
- Auto-corrections en cas d’erreur
- Nettoyage, normalisation et structuration des données
- Export CSV / API / base de données

💡 Objectif : vous fournir des données fiables et directement exploitables par vos équipes (ou vos modèles LLM ✨)

🎓 Master 2 Intelligence Artificielle – École des Ponts
  • Anglais

    Capacité professionnelle complète

  • Français

    Bilingue ou natif

  • Espagnol

    Capacité professionnelle limitée

En télétravail uniquement
Travaille majoritairement à distance

Expériences

  • LBF
    Logo MaltSur Malt
    Base de données B2B des bars et restaurants à Paris + 92/93/94/95 avec emails vérifiés + téléphones
    RESTAURATION
    octobre 2025 - novembre 2025 (1 mois)
    Paris, France
    🚀 Scraping & Qualification – Restaurants (Paris + IDF)

    Mise en place d’un pipeline IA pour constituer une base ultra qualifiée de bars & restaurants (Google Maps + Uber Eats).

    Réalisations :
    • Identification du site officiel (exclusion marketplaces)
    • Extraction emails pro + mobiles 06/07
    • Scoring intelligent des emails (priorisation des contacts exploitables)
    • Vérification MX/DNS/SMTP pour réduire les bounces
    • Fusion & dédoublonnage multi-sources
    Résultat :
    • Base propre, structurée et prête CRM
    • Taux de délivrabilité optimisé
    • Campagnes d’outreach plus performantes
    Livrable : CSV/XLSX structuré + traçabilité des sources.
    Web Scraping Prospection B2B Google Maps Google Maps API n8n
  • Geoplanete France SAS
    Logo MaltSur Malt
    Automatisation catalogue produits Shopify (scraping + IA + intégration Matrixify)
    E-COMMERCE
    septembre 2025 - novembre 2025 (2 mois)
    Paris, France
    🧩 Automatisation catalogue Shopify – Geoplanete (Website → Shopify)

    Mise en place d’un pipeline complet pour automatiser l’intégration du catalogue produits vers Shopify.

    Réalisations :
    • Développement d’un scraper robuste (produits, variantes, accessoires, images, PDF techniques)
    • Normalisation et nettoyage avancé des données (attributs, prix, poids, SEO, métadonnées)
    • Enrichissement automatisé des descriptions et FAQ via GPT-5 (prompt engineering + fiabilisation)
    • Génération du catalogue via Matrixify (stocks, métachamps, marques, relations produits)
    • Import en Draft dans Shopify pour validation (50+ produits testés)
    • Mise en place d’un process réplicable pour futurs fournisseurs
    Résultat :
    Un pipeline automatisé permettant d’importer des centaines de produits propres et enrichis en quelques minutes, supprimant la saisie manuelle et rendant l’ajout de nouveaux catalogues scalable.
    Développement Shopify Développeur Shopify boutique shopify Automatisation Automatisation des tâches
  • Expertual invest SL
    Logo MaltSur Malt
    Data Engineer & Développeur Python — scraping et structuration de documents fiscaux, pipeline RAG
    EDITION DE LOGICIELS
    juillet 2025 - août 2025 (1 mois)
    Paris, France
    - Collecte & parsing de documents fiscaux espagnols (PDF/HTML) avec pipeline robuste (retries, logs).

    - Nettoyage / normalisation des métadonnées (période, émetteur, type de document).

    - Indexation : base Postgres + schéma optimisé, stockage des fichiers et contenus.

    - Résumé & classification automatiques via OpenAI (labels métiers + synopsis par document).

    - Synchronisation Airtable pour consultation et suivi (~60 000 docs).

    - Qualité & industrialisation : tests, monitoring, alerting, scripts de reprise.

    - Préparation phase 2 : conception d’un chatbot RAG (recherche sémantique, historisation, permissions).

    Stack principale : Python, FastAPI, Playwright/Requests, BeautifulSoup, PostgreSQL (+pgvector), OpenAI API, Airtable API, Docker, CI/CD.
    RAG Retrieval-Augmented Generation (RAG) OpenAI Prompt engineering intelligence artificielle

Avis

5,0

sur 39 évaluations

J

Julien

Mighty Nine

Avis laissé le 18.11.2025

Je recommande à 100% Simon. Pro, réactif, rapide, sérieux.
T

Théobald

Geoplanete France SAS

Avis laissé le 18.11.2025

Un vrai plaisir de travailler avec Simon sur cette mission. Un sens du professionnalisme aigu, un suivi précis de chaque étape et des prochaines avancées. En plus d'un travail parfaitement finalisé, nous avons apprécié la force de proposition et de solution, dont a fait preuve Simon tout au long du projet.

Simon a choisi de masquer 1 avis de fin de projet

1 avis écrit est privé.

Recommandations

Soyez le premier à recommander Simon

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master Ingénierie Financière
    Université Paris Dauphine
    2016
    Modèles probabilistes, produits dérivés.
  • Machine Learning (intelligence artificielle)
    Ecole Nationale des Ponts et Chaussées
    2017
    Neural Networks, SVM, k-means, spectral clustering

Compétences

Catégories