MAMaxFolio
Tous les projets

ASV (ActuWorld Source Verification)

2025FastAPIPythonReact 19TypeScript

ASV (Actuworld Source Verification) est le sous-système de vérification des sources intégré à ActuWorld. Il analyse les URLs, évalue leur crédibilité via une base de 301 domaines vérifiés, et bloque les publications avec sources insuffisantes. Backend FastAPI avec scoring avancé (SSL, WHOIS, Google Safe Browsing, NLP). Composant critique du système de confiance d'ActuWorld.

En bref

  • Composant critique d'ActuWorld : fournit la couche de vérification des sources
  • 301 domaines vérifiés (institutions officielles, médias, académie, organisations)
  • Vérification posts texte : Phase 1A MVP en production avec scoring 0-10
  • Analyse multimédia : Phase 2 avec transcription Whisper + extraction NLP des claims
  • Feature 5 (Scoring avancé) : Google Safe Browsing, SSL validation, WHOIS age check, page metadata
  • Feature 6 (Sémantique) : Détecte contradictions et cohérence thématique via Gemini
  • Feature 4 (Crowdsourcing) : Infrastructure prête pour rating utilisateurs
  • Docker + Nginx : Frontend et backend containerisés, intégration fluide à ActuWorld

Problème adressé

La désinformation se propage rapidement sur les réseaux sociaux. Manque de vérification des sources, URLs inaccessibles, domaines malveillants non détectés, absence d'évaluation crédibilité.

Solution apportée

ASV fournit une couche de vérification automatique qui détecte les URLs, valide la sécurité HTTPS, évalue la crédibilité (0-10), et bloque publication si sources insuffisantes. Interface simple : copier/coller un post et voir le scoring instantanément.

Fonctionnalités

  • Reconnaissance automatique des URLs et extraction du domaine source
  • Validation sécurité HTTPS + SSL avec signalement des risques
  • Scoring crédibilité 0-10 avec critères explicables
  • Transcription audio/vidéo (Whisper)
  • Extraction NLP (SpaCy)
  • Détection de cohérence sémantique via Gemini

Défis techniques

  • Maintenir base 301 domaines à jour
  • Gérer faux positifs/négatifs scoring
  • Performance transcription (5min audio en ~30s)
  • Intégration services externes multiples
  • Déploiement architecture multi-service
  • Traçabilité des décisions de scoring pour l'équipe éditoriale

Prochaines étapes

  • Feature 4 (crowdsourcing endpoints)
  • Feature 6 (vérification sémantique)
  • Browser Extension
  • Tests E2E automatisés
  • API B2B avec authentification
  • Intégration ActuWorld mobile