Méthodologie publique

Comment plusieurs IA analysent les programmes

Cette démarche ne repose pas sur un seul modèle. Pendant toute une nuit, plusieurs IA ont analysé les mêmes programmes avec la même grille, puis leurs lectures ont été comparées, challengées et synthétisées pour produire une évaluation finale cohérente pour tous les candidats.

6 candidats analysés4 modèles challengés5 critères publicsMême corpus pour tousRapports PDF téléchargeables

Position du projet

Le site ne vend pas un service. Il publie une analyse comparative non partisane des programmes municipaux 2026. L'objectif est de rendre le débat plus lisible, pas de recommander un vote.

Non partisan
Aucune affiliation politique
🔎
Transparent
Critères et rapports publics
📈
Reproductible
Même grille pour tous

Pourquoi faire tourner plusieurs modèles ?

Réduire l’effet d’un modèle unique

Chaque programme est lu par plusieurs modèles. Si l’un sur-réagit à un angle ou oublie un point, les autres servent de contrepoids.

Faire ressortir les convergences

Quand Opus, Grok, GPT-5.4 et Mistral remontent les mêmes forces, les mêmes faiblesses ou les mêmes zones floues, le signal devient plus robuste.

Challenger les divergences

Quand les lectures s’écartent, les justifications sont remises face au texte source pour distinguer une vraie divergence d’une sur-interprétation.

Produire une synthèse finale

La note finale ne reprend pas la sortie brute d’une seule IA. Elle agrège les lectures communes, arbitre les désaccords et garde une grille identique pour tous.

Corpus analysé

L'analyse repose exclusivement sur des sources publiques. Aucune information privilégiée ni déclaration off-the-record n'est utilisée.

Programmes officiels
Documents publiés par les équipes de campagne sur leurs sites et réseaux
Propositions détaillées
Mesures chiffrées, calendriers, dispositifs concrets annoncés publiquement
Engagements thématiques
Prises de position sur logement, transport, sécurité, écologie, budget

Processus d'analyse

L'idée n'est pas de demander son avis à une seule IA. Le protocole consiste à faire travailler plusieurs modèles sur le même matériau, puis à confronter leurs sorties avant de retenir une synthèse finale.

1

Collecte du corpus

Récupération du programme officiel et des propositions détaillées du candidat.

2

Passage de nuit sur plusieurs modèles

Opus, Grok, GPT-5.4 et Mistral reçoivent le même corpus, la même consigne et la même grille d’évaluation.

3

Comparaison des lectures

Les notes proposées, les objections, les points forts, les faiblesses et les angles morts sont mis côte à côte pour voir où les modèles convergent.

4

Challenge des désaccords

Les divergences sont re-testées sur le texte source pour identifier les surestimations, omissions, contradictions internes ou mesures hors compétence municipale.

5

Synthèse finale et moyenne argumentée

Une synthèse finale retient les convergences entre modèles et arbitre les désaccords. Elle produit 5 notes finales, puis une note globale en moyenne équipondérée.

6

Génération du rapport PDF

Le rapport complet documente la synthèse retenue, les points de consensus, les points de tension et la note finale mise à disposition sur la page du candidat.

Important : la moyenne ne porte pas sur une humeur ou un vote automatique entre IA. Elle porte sur des lectures argumentées, comparées puis challengées sur le texte source.

Les 5 critères d'évaluation

1. Cohérence interne

Le programme présente-t-il une logique d’ensemble sans contradiction interne ?

Exemple: un candidat qui promet densification massive et 300 ha de jardins crée une tension de cohérence.

2. Solidité technique

Les propositions reposent-elles sur des hypothèses crédibles (budget, droit, exécution) ?

Exemple: des chiffrages précis (900M€ rénovation logements) vs. des promesses sans budget.

3. Robustesse budgétaire

Le plan reste-t-il tenable en cas d’aléas, de hausse des taux ou de contraintes imprévues ?

Exemple: un plan d’économies de 4Mds€ documenté vs. aucun chiffrage global du programme.

4. Pragmatisme

Les mesures sont-elles actionnables à l’échelle municipale, dans les compétences de la mairie ?

Exemple: «métro 24h/24» relève de la Région, pas de la mairie = hors compétence.

5. Détail et précision

Le niveau de précision permet-il une lecture opérationnelle (calendriers, coûts, modalités) ?

Exemple: «300 capteurs acoustiques Méduses» = précis vs. «un grand plan de mise à l’abri» = flou.

Les 5 domaines thématiques

Au-delà des 5 critères transversaux, chaque programme est analysé sur 5 domaines clés de la politique municipale parisienne.

🏠

Logement

  • Logement social et privé
  • Lutte contre la spéculation
  • Rénovation énergétique
  • Encadrement des loyers
🚌

Transport

  • Réseau cyclable
  • Transports en commun
  • Stationnement
  • Plan de circulation
🛡

Sécurité

  • Police municipale
  • Vidéoprotection
  • Lutte contre les incivilités
  • Sécurité nocturne
🌿

Écologie

  • Végétalisation
  • Transition énergétique
  • Qualité de l’air
  • Alimentation durable
💰

Budget / Fiscalité

  • Plan de financement
  • Endettement
  • Fiscalité locale
  • Subventions État/Région

Structure de chaque rapport

Chaque candidat reçoit un rapport d'analyse complet (PDF téléchargeable) qui suit toujours la même structure.

1.
Résumé exécutif
Note globale, 3 forces principales, 3 faiblesses principales, verdict en 1 phrase.
2.
Analyse par critère
5 sections détaillées (cohérence, solidité, robustesse, pragmatisme, détail) avec note, points forts, points de tension et exemples concrets.
3.
Analyse thématique
Logement, Transport, Sécurité, Écologie, Budget — avec forces et faiblesses pour chaque domaine.
4.
Points d’attention critiques
Propositions irréalistes, contradictions internes, angles morts identifiés dans le programme.
5.
Contexte municipal
Comparaison avec Hidalgo, propositions en rupture, mesures hors compétences municipales.
6.
Conclusion
Justification de la note, crédibilité et applicabilité globale du programme.
7.
Annexes
Inventaire détaillé de toutes les propositions classées par domaine, analyse de faisabilité.

Pondération des notes

Chaque critère compte pour 20% de la note globale, une fois la synthèse multi-modèles consolidée.

Cohérence
20%
Solidité
20%
Robustesse
20%
Pragmatisme
20%
Détail
20%

Note globale = (Cohérence + Solidité + Robustesse + Pragmatisme + Détail) ÷ 5. L'équipondération intervient après comparaison des lectures pour éviter qu'un seul modèle impose son angle.

Lecture des scores

7+
Solide
Programme cohérent, crédible, documenté
5-7
Mitigé
Avancées notables mais limites structurelles
<5
Fragile
Insuffisances de réalisme ou de précision

Rapports téléchargeables

L'intégralité de l'analyse de chaque candidat est disponible en PDF. Consultez-les pour vérifier le raisonnement derrière chaque note.

Limites de l'analyse

!

L’IA évalue les programmes tels que publiés, pas les intentions réelles ni le bilan passé des candidats.

!

Les notes reflètent la qualité du programme écrit, pas la capacité personnelle du candidat à gouverner.

!

Le multi-modèles réduit le risque d’un biais propre à une seule IA, mais ne l’annule pas.

!

L’analyse ne prend pas en compte les coalitions, alliances ou dynamiques politiques de second tour.

!

Les scores ne mesurent pas l’adhésion populaire ni l’opinion des électeurs.

!

Un consensus entre modèles peut rester trompeur si le texte source est lui-même ambigu, incomplet ou stratégiquement flou.

Transparence

Les scores ne remplacent pas le débat démocratique. Ils structurent la lecture et rendent explicites les zones de solidité, les contradictions et les points à clarifier. L'objectif n'est pas de déléguer un jugement à une IA, mais de confronter plusieurs lectures avant publication. Chaque citoyen est invité à télécharger les rapports complets et à se forger sa propre opinion.

Open source

Réutilisez ce projet pour n'importe quelle élection

L'intégralité du code source de ce site est publiée en open source. L'objectif : permettre à quiconque de reproduire cette démarche d'analyse pour d'autres élections, dans d'autres villes, dans d'autres pays. Même grille, même rigueur, même transparence.

Tous les repos sont sous licence MIT. Forkez, adaptez, déployez librement.