Comment j'ai construit un agent IA qui qualifie mes leads en autonome
J'ai construit un agent IA qui trouve des entreprises, vérifie leurs données légales, analyse leur site web, cherche le dirigeant sur LinkedIn, attribue un score de qualification, et met à jour mon CRM. Sans intervention humaine.
En 3 jours, il a traité 101 leads. 48 sont devenus des prospects qualifiés. Le tout pour environ 35 euros.
Cet article est le retour d'expérience complet : l'architecture, les choix techniques, les erreurs, les métriques réelles. Pas un tutoriel théorique sur "les agents IA en 2026". Un système qui tourne.
Ce que fait l'agent, concrètement
Mon activité de développeur freelance cible les PMEs françaises de 10 à 50 salariés. Des entreprises du BTP, de l'agroalimentaire, du négoce. Des boîtes avec des process manuels, des dirigeants jeunes, et pas d'équipe IT interne.
Le problème : trouver ces entreprises, une par une, et vérifier qu'elles correspondent à mes critères. C'est un travail de recherche long, répétitif, et ingrat. Exactement le genre de tâche qu'un agent IA sait faire.
L'agent fonctionne en deux modes :
Mode Découverte : il cherche de nouveaux leads. Il interroge les registres d'entreprises, analyse des sites web, fouille les annuaires professionnels, lit la presse locale. Il trouve des entreprises que je n'aurais jamais trouvées manuellement.
Mode Enrichissement : il prend des leads existants dans mon CRM et les qualifie. Il vérifie les données légales, analyse le site web, cherche le profil LinkedIn du dirigeant, attribue un score, et met à jour la fiche.
Un lead passe par 5 étapes en moins de 30 secondes :
- Vérification des doublons dans le CRM
- Recherche des données légales (registre des entreprises)
- Analyse du site web et recherche LinkedIn du dirigeant
- Scoring selon une grille de qualification
- Mise à jour CRM et archivage
Les étapes 2 et 3 tournent en parallèle. Si une donnée éliminatoire apparaît (entreprise trop grosse, dirigeant trop âgé, équipe informatique en interne), l'agent disqualifie en 4 secondes et passe au suivant.
L'architecture : une équipe d'agents spécialisés
La première version faisait tout dans un seul programme. L'agent lisait les pages web, appelait les registres, scorait les leads, le tout dans le même fil de conversation. Chaque lead coûtait environ 2 dollars et prenait une minute.
Le problème : au bout de 8 leads, l'agent saturait. Trop d'informations accumulées, plus assez de place pour raisonner.
La version actuelle fonctionne comme une équipe. Un chef d'orchestre distribue le travail à 4 agents spécialisés, chacun tourné par le modèle d'IA le moins cher capable de faire le travail.
Le chef d'orchestre (modèle le plus capable) prend les décisions : quel lead traiter, quelles données combiner, quand disqualifier.
L'agent vérificateur (modèle rapide et économique) compare le nom du lead avec tous les leads déjà dans le CRM. Un seul appel, 200 noms comparés d'un coup.
L'agent registre (modèle économique) interroge l'API gouvernementale des entreprises. Il obtient le nombre de salariés, l'activité, la date de naissance du dirigeant. Si le dirigeant a plus de 45 ans ou l'entreprise plus de 50 salariés, il renvoie immédiatement "éliminé" sans aller plus loin.
L'agent web (modèle économique) analyse le site web de l'entreprise et cherche le profil LinkedIn du dirigeant. Il extrait 3-5 informations clés : activité principale, signaux de process manuels, présence d'une équipe informatique, coordonnées.
L'agent scoring (modèle intermédiaire) reçoit toutes les données combinées et applique la grille de qualification. Il ne fait aucune recherche : il juge.
Les agents registre et web tournent en même temps. C'est ce qui permet de passer de 60 secondes à 25 secondes par lead.
Et le modèle économique coûte 25 fois moins que le modèle le plus capable. En déléguant les tâches mécaniques aux agents économiques, le coût par lead est passé de 2 dollars à 0.32 dollar. Six fois moins cher.
La grille de scoring
L'agent ne "devine" pas si un lead est bon. Il applique une grille de critères pondérés, construite à partir de mon expérience de prospection.
Critères éliminatoires (disqualification immédiate) :
- Plus de 50 salariés (trop gros, pas ma cible)
- Entreprise inactive au registre
- Dirigeant de plus de 45 ans
- Secteur du recrutement
- Pas de profil LinkedIn du dirigeant
- Équipe informatique en interne
Grille de scoring (sur 100 points) :
| Critère | Points |
|---|---|
| 10-49 salariés | +25 |
| Dirigeant de moins de 35 ans | +20 |
| Dirigeant de 35-45 ans | +10 |
| LinkedIn du dirigeant trouvé | +15 |
| Équipe commerciale détectée | +10 |
| Signaux de process manuels | +15 |
| Site web analysé | +5 |
| Téléphone trouvé | +5 |
| Pas d'équipe informatique | +10 |
| Secteur non-tech | +5 |
Un lead qui obtient 60 ou plus devient "Prospect" dans le CRM. Entre 40 et 59, il passe en "À revoir". En dessous, il est disqualifié.
Sur 101 leads traités :
- 48 Prospects (47%) -- qualifiés, prêts pour un premier contact
- 7 À revoir (7%) -- données incomplètes, à vérifier manuellement
- 46 Disqualifiés (46%) -- hors cible
Le score moyen est de 71/100. Les 8 meilleurs leads ont obtenu 100/100.
Les vrais chiffres : 3 jours, 4 versions, 101 leads
L'agent n'est pas né parfait. Il a fallu 4 itérations en 3 jours pour arriver à la version actuelle.
Jour 1 : le prototype
Première version brute. Un programme monolithique qui fait tout lui-même. 12 leads traités. Ça marche, mais c'est lent, cher, et l'agent perd le fil après 8 leads.
Jour 1, version 2 : l'auto-apprentissage
J'ai étudié des travaux de recherche sur les agents autonomes, notamment ceux d'Andrej Karpathy (ex-directeur IA chez Tesla). Sept principes extraits et appliqués :
- Autonomie stricte : l'agent ne s'arrête jamais pour demander la permission entre deux leads
- Élimination rapide : disqualifier en 4 secondes au lieu de perdre 60 secondes sur un lead hors cible
- Auto-review : en fin de session, l'agent écrit ce qui a marché et ce qui a échoué
- Journal de stratégies : un fichier où l'agent note ses leçons. Il le relit avant chaque nouvelle session.
Le journal de stratégies est la pièce maîtresse. L'agent apprend de ses propres erreurs. 39 entrées à ce jour : 13 approches qui fonctionnent, 10 à ne jamais retenter, 16 résultats mitigés avec des pistes d'amélioration.
Jour 3 : l'équipe d'agents
Le vrai saut. J'ai découpé le programme en agents spécialisés (décrits plus haut). Chacun a un cahier des charges strict : quels outils il peut utiliser, quel modèle d'IA le fait tourner, quel format de réponse il doit respecter.
Comparaison jour 1 vs jour 3 :
| Métrique | Jour 1 | Jour 3 |
|---|---|---|
| Coût par lead | ~2.00 $ | ~0.32 $ |
| Temps par lead | ~60s | ~25s |
| Leads avant saturation | ~8 | 15+ par session |
| Élimination rapide | 0% (tout prend 60s) | 45% éliminés en moins de 5s |
Ce qui a marché (et ce qui a échoué)
Les stratégies de découverte qui fonctionnent
1. Registre des entreprises avec filtres métier
Le registre gouvernemental des entreprises françaises permet de chercher par code d'activité et par tranche d'effectif. En combinant ça avec un filtre sur l'âge du dirigeant, le taux de qualification atteint 27%. Quatre leads qualifiés sur quinze trouvés.
Exemple réel : en cherchant les entreprises de chauffage, 10-49 salariés, en Occitanie, l'agent a trouvé Vautier & Fils. Nicolas Vautier, 33 ans, gérant. Score : 100/100.
2. Presse locale et reprises d'entreprises familiales
Les articles du Journal des Entreprises sur les reprises familiales sont une mine. Un article "Ces jeunes qui reprennent l'entreprise familiale" a directement produit 2 leads qualifiés sur 3 vérifiés.
Pourquoi ? Un jeune dirigeant qui reprend l'entreprise de ses parents, c'est exactement mon profil cible : quelqu'un qui veut moderniser des process existants.
3. Recherche par ville moyenne
Brest, Quimper, Angers fonctionnent mieux que Paris ou Lyon. Moins de concurrence, dirigeants plus accessibles, entreprises dans ma cible de taille.
Les stratégies qui ne marchent pas
1. Recherche brute dans les bases de données
Chercher "construction" dans le registre retourne des résultats aléatoires. Pas de filtre par âge, pas de tri par pertinence. Inutile.
2. Google générique
"PME BTP dirigeant jeune LinkedIn" ne retourne que des articles de presse et des offres d'emploi. Google ne sait pas trouver des profils d'entreprises spécifiques avec ce type de requête.
3. Le transport routier
80% de disqualification. Les dirigeants du transport ont massivement plus de 50 ans, et aucun n'a de profil LinkedIn. Le journal de stratégies a retenu la leçon : ne plus chercher dans ce secteur.
4. L'industrie lourde
Même problème. Plasturgie, usinage, décolletage : les dirigeants sont systématiquement au-dessus de 50 ans. C'est un secteur de transmission tardive.
La raison n.1 de disqualification
Sur 46 leads disqualifiés, 36 l'ont été pour une seule raison : l'âge du dirigeant (plus de 45 ans). C'est 78% des disqualifications.
Le reste : 7 parce que le dirigeant n'avait pas de LinkedIn (15%), 2 parce que l'entreprise était trop grosse, 1 parce qu'il y avait une équipe informatique en interne.
C'est logique : un dirigeant de 55 ans qui gère sa boîte depuis 20 ans a trouvé ses habitudes. Un dirigeant de 33 ans qui vient de reprendre l'entreprise familiale veut tout moderniser.
L'agent obtient cette information gratuitement via le registre gouvernemental (date de naissance des dirigeants). L'élimination sur l'âge prend 4 secondes au lieu de 25 pour analyser un site web et chercher sur LinkedIn. C'est le filtre le plus efficace du système.
Le backend : 200 lignes de Python et un Google Sheet
Pas de base de données. Pas d'infrastructure cloud.
Le CRM, c'est un Google Sheet. Le backend, c'est un petit serveur en Python qui expose 8 outils à l'agent :
- Lire et écrire dans le CRM
- Chercher une entreprise dans le registre gouvernemental
- Lire et écrire le journal de recherche (historique des leads)
- Lire et écrire le journal de stratégies (leçons apprises)
Ce serveur utilise le protocole MCP (Model Context Protocol), un standard ouvert qui permet à un agent IA de se connecter à n'importe quelle source de données. L'équivalent d'une prise USB pour l'IA : un branchement universel.
200 lignes de code. Il tourne en local sur mon ordinateur. L'agent l'appelle comme n'importe quelle fonction.
Pourquoi Google Sheets et pas une vraie base de données ? Parce que c'est suffisant. 101 lignes, 20 colonnes. Je peux voir, filtrer, trier mes leads directement dans le tableur. La complexité minimum pour que ça marche.
Les 8 meilleurs leads trouvés par l'agent
Pour donner une idée concrète de ce que l'agent produit :
| Score | Entreprise | Activité | Dirigeant |
|---|---|---|---|
| 100 | Vautier & Fils | Chauffage, clim, photovoltaïque | Nicolas Vautier, 33 ans |
| 100 | Special Menuiseries | Menuiserie extérieure, 4 showrooms | Marie Gioia, 35 ans |
| 100 | Confort 3000 | Menuiserie, fabrication locale | Adèle Barroso, 31 ans |
| 100 | Rambaud Espaces Verts | Création jardins, entretien | Sébastien Rambaud, 33 ans |
| 100 | Biscuiterie Fine de France | Biscuits, macarons artisanaux | Pierre-Etienne Robert, 39 ans |
| 100 | Soc Giteau | Menuiseries PVC/alu sur-mesure | Florent Dumant, 37 ans |
| 100 | Ferme Saint Christophe | Conserverie artisanale | Simon Van Oost, 38 ans |
| 100 | Le Roi Solaire | Énergie solaire | Damien Fodera, 43 ans |
Le profil type : PME de 10-49 salariés, activité physique ou terrain, dirigeant de 31-43 ans, souvent une reprise familiale ou une création récente. Ce sont des gens qui gèrent des commandes par email, des plannings sur papier, des devis sur Excel. Exactement le genre d'entreprise à qui un outil métier sur-mesure change la vie.
Ce que j'aurais fait différemment
1. Commencer directement avec les agents spécialisés.
J'ai perdu une journée sur un programme monolithique avant de comprendre que la délégation était indispensable. Si c'était à refaire, je découperais en agents spécialisés dès le premier jour.
2. Ne pas tester dans le transport et l'industrie lourde.
Le journal de stratégies m'a appris ça, mais j'aurais pu le deviner. Les secteurs avec une transmission tardive ne sont pas ma cible. J'aurais dû commencer par le BTP artisanal et l'agroalimentaire, là où les reprises familiales créent des dirigeants jeunes.
3. Limiter la lecture des sites web dès le début.
Au départ, l'agent lisait des pages entières. Des milliers de mots par site. Avec le recul, 3-5 informations clés extraites suffisent largement pour la qualification.
Combien ça coûte, en vrai
Le coût réel pour traiter 101 leads :
- Coût total : environ 35 $
- Coût par lead : ~0.35 $
- Leads qualifiés : 48 Prospects
- Coût par prospect qualifié : ~0.73 $
Pour comparaison, un outil de prospection B2B classique (Apollo, Lusha, ZoomInfo) coûte entre 100 et 500 euros par mois, et ne fait pas la qualification sur-mesure.
Un commercial qui fait cette recherche manuellement, à 30 minutes par lead, aurait mis 50 heures. À un coût chargé de 50 euros de l'heure, ça fait 2 500 euros.
L'agent a fait le même travail pour 35 euros.
Ce que ça change pour mon activité
L'agent ne remplace pas la vente. Il remplace la recherche. La partie la plus chronophage et la moins intéressante du cycle commercial.
Avant, je passais des heures sur societe.com et LinkedIn à chercher des entreprises qui correspondent à mes critères. Je vérifiais manuellement les données légales, je cherchais le dirigeant, j'essayais de deviner si l'entreprise avait des process manuels.
Maintenant, j'ouvre un terminal, je lance l'agent, et 15 minutes plus tard j'ai une liste de 10-15 prospects qualifiés avec toutes leurs informations. Il me reste le travail que seul un humain peut faire : écrire le premier message, comprendre le contexte spécifique, construire la relation.
L'IA ne fait pas tout. Elle fait ce qu'elle sait faire : traiter du volume, croiser des données, appliquer des règles. Le reste reste humain.
FAQ
Combien de temps faut-il pour construire un agent IA de ce type ?
Trois jours pour la version fonctionnelle, en partant de zéro. Mais j'avais déjà l'expertise technique (développeur fullstack, familier avec les APIs d'IA). Pour quelqu'un qui débute, compter 2-3 semaines avec un accompagnement.
L'agent peut-il contacter les leads lui-même ?
Non, et c'est un choix délibéré. L'agent qualifie. Le premier contact reste humain. Un message automatisé envoyé par une IA n'a pas la même valeur qu'un message écrit par quelqu'un qui a compris le contexte.
Ça marche dans d'autres secteurs que le BTP ?
Oui. L'agent a qualifié des leads dans l'agroalimentaire (biscuiterie, conserverie), la cosmétique (compléments alimentaires), le négoce alimentaire régional, les espaces verts. La grille de scoring s'adapte. Les critères éliminatoires restent les mêmes.
Quelle est la fiabilité des données ?
Les données légales viennent directement du registre gouvernemental. Fiabilité très haute. L'analyse web et la recherche LinkedIn sont moins fiables (pages non mises à jour, profils incomplets). L'agent note les données manquantes et ajuste le score en conséquence.
Est-ce que ça remplace un CRM ?
Non. L'agent alimente un CRM (un Google Sheet dans mon cas). Il ne gère pas le suivi commercial, les relances, le pipeline de vente. C'est un outil de qualification, pas un outil de gestion commerciale.
Le système est-il adaptable à d'autres besoins ?
L'architecture (un chef d'orchestre, des agents spécialisés, un connecteur données, une grille de scoring) est générique. Les critères de recherche et la grille de scoring sont spécifiques à mon cas. Pour adapter le système, il faut redéfinir les critères et les sources de données. La structure reste la même.
C'est quoi un agent IA, exactement ?
Un agent IA, c'est un programme capable de comprendre un objectif, de planifier les étapes pour l'atteindre, et d'exécuter ces étapes en utilisant des outils (recherche web, appels à des registres, lecture de documents). Contrairement à un chatbot qui répond à des questions, un agent agit. Il prend des décisions, enchaîne des actions, et s'adapte en fonction des résultats.
Articles sur le meme sujet
Aides et subventions pour la digitalisation des PME en 2026 : le guide pratique
BPI France, France Num, CII, aides régionales : toutes les aides pour financer la digitalisation de votre PME en 2026. Montants, conditions, démarches.
Automatisation et IA pour les entreprises en Aveyron
Automatisez vos process et intégrez l'IA dans votre PME en Aveyron. Exemples concrets, aides disponibles, et résultats mesurables.
Automatiser sa PME : guide concret pour gagner 10h par semaine
Comment automatiser les process de votre PME pour gagner 10h par semaine. Exemples concrets, ROI chiffré et méthode pas à pas.
Un projet en tete ?
Reserver un appel