โ† Retour aux previews
Roadmap 2026 / Phase 0

Deep Research : ce qu'on a trouve, ce qu'on attend de vous

3 sujets etudies par 3 devs, chacun avec un Deep Research multi-provider (3 IA independantes), puis confrontation au terrain (code, donnees reelles, Grafana).

Aujourd'hui : les conclusions et les decisions qui dependent du metier.

Notre approche

Chaque dev a pris un sujet de la roadmap et suivi un processus structure en 4 etapes.

1

Cadrage

Formuler les bonnes questions avec le dev. Iterer via Q&A interactif pour affiner les axes.

โ†’
2

Deep Research

3 IA independantes (OpenAI o3, o4-mini, Gemini) cherchent en parallele. Rapports de 5-15 pages chacun.

โ†’
3

Confrontation terrain

Le dev confronte les resultats au code, aux donnees reelles, a Grafana. C'est la que les biais tombent.

โ†’
4

Decision

Identifier les gates, les next steps, et ce qui depend du metier.

La recherche IA : un accelerateur, pas un oracle

Le DR produit de la matiere riche en quelques heures. Mais il se trompe regulierement sur notre contexte. C'est en le confrontant au terrain qu'on trouve les vraies conclusions.

Ce que ca fait bien

  • Balayer un sujet large en quelques heures
  • Identifier des options qu'on n'aurait pas vues
  • Challenger nos intuitions (Red Team)
  • Structurer un plan d'action par phases

Ou ca se trompe

  • Suppose des choses fausses sur notre architecture
  • Formule les questions avec un biais "il faut le faire"
  • Les chiffres d'uplift viennent du marketing des providers
  • Ne connait pas notre contexte terrain

Exemple concret : ID Externes

Le DR recommandait
  • Pluguer 2-3 nouveaux providers S2S en urgence
  • Investir 60-90 jours de dev
  • Devenir operateur UID2
5 minutes de log terrain
  • On forward deja 200+ sources EU, 500+ US
  • Probablement pas besoin de pluguer quoi que ce soit
  • Le gain marginal de UID2 est faible vu ce qu'on a

Le DR estimait l'etat des lieux a 2-3 jours. Yann l'a fait en 5 minutes. Sans cette verification, on serait parti dans du dev inutile.

Les 3 sujets etudies

Attention KPI โ€” Un sujet reel mais premature

L'attention est une metrique emergente demandee par le marche. Mais on n'a pas les informations pour decider.

1

Pas de standard marche

Chaque provider (IAS, Adelaide, Lumen) a sa propre definition. Pas de spec commune. Si on developpe un score maison, rien ne garantit qu'il sera reconnu.

2

L'objectif n'est pas de vendre aux DSP

C'est de conditionner nos offer templates en interne. On ne met pas un score attention dans la bid request. On veut mieux placer nos offres sur l'inventaire qui capte l'attention.

3

On n'a pas les infos pour decider

Personne n'a fait de devis chez les providers. Personne n'a demande aux DSP s'ils paieraient plus cher. Le DR dit "trop cher" mais on n'a aucun chiffre.

Risques identifies (Red Team)

  • Fraude โ€” Un editeur malveillant peut simuler des signaux d'attention (jeu du chat et de la souris)
  • Reputation โ€” Si on vend du "premium attention" et qu'on se fait avoir : impact reputationnel
  • Ressources โ€” Pas de personne dediee = timeline qui s'etire (18-24 mois estimes)
  • Technique โ€” Le heartbeat 15s du DR est incompatible avec notre refresh 7-10s

Ce qu'on attend de vous

1
Demander des devis a Adelaide, Lumen, IAS โ€” combien ca coute, comment ca marche, est-ce que ca fonctionne sur apps mobile ? Bruno / Commercial
2
Sonder 5 top partenaires โ€” Y a-t-il un champ OpenRTB dedie a l'attention ? Seraient-ils prets a payer plus pour un signal attention fiable ? Bruno / Commercial
3
Confirmer l'usage โ€” On veut conditionner nos offer templates en interne, pas vendre une offre attention aux DSP. C'est bien ca ? Bruno
Regle de decision : Si les devis sont < 30K EUR/an โ†’ probablement plus simple d'acheter. Si 0/5 DSP interesses โ†’ on abandonne le build. Si devis hors budget ET DSP interesses โ†’ on relance la phase de dev.

Bouton Tests Extremes โ€” Un POC de 3 jours avant tout

Un bouton "derniere chance" pour tenter de ressusciter un editeur blackliste โ€” on bypass les blacklists internes, on boost le CPM, et on observe pendant 7 jours.

7 jours
Duree standard d'un test
96h incompressibles (algo Profitability V5)
20K
Impressions minimum
Pour conclure statistiquement
3 max
Tests simultanes
QPS partenaires quasi-satures

Ce qu'on fait

  • Bypass blacklists internes SW uniquement
  • Boost CPM pour attirer les reponses
  • Rollback automatique si non concluant
  • Pre-qualification obligatoire (ads.txt, volume, score qualite)

Ce qu'on ne fait PAS

  • Toucher a la blacklist DSP โ€” "un coup a se pourrir le bidder"
  • Laisser ouvert apres un test non concluant
  • Plus de 3 tests en parallele
  • Tester un editeur sans ads.txt valide

Decouverte en live

Un editeur montre en exemple pendant la prez avait sa ligne ads.txt mal formatee (espaces au lieu de virgules). Le bouton ne l'aurait jamais sauve โ€” c'est un probleme de setup basique, pas d'algo.

Vision long terme : le bouton est un patch temporaire. La vraie solution est le Thompson Sampling (exploration automatique), prevu H1 2027.

Ce qu'on attend de vous

1
Combien d'editeurs sont reellement sauvables ? โ€” Croiser volume adcalls, score qualite, ads.txt valide. Si < 50 editeurs eligibles, le dev complet ne vaut peut-etre pas le coup. Adel / BU Publisher
2
Quelle valeur revenue representent ces editeurs ? โ€” Si les editeurs sauvables representent 500 EUR/mois de revenu potentiel, le ROI du dev est negatif. Adel
3
Qui aura acces au bouton ? โ€” Initialement 3 personnes (Head of Yield + 1 PM), puis eventuellement toute la BU Publisher. Adel / Max
Regle de decision : POC non concluant โ†’ on abandonne le bouton. < 50 editeurs eligibles โ†’ on reevalue le scope. POC concluant + scope suffisant โ†’ on lance le dev UI.

ID Externes โ€” On a deja ce qu'il faut

5 minutes de log reseau sur un front EU et un front US ont change toutes les conclusions.

~200
Sources external ID (Europe)
Sur 400K adcalls en 5 min
500+
Sources external ID (US)
Sur 400K adcalls en 5 min
>80%
Adcalls avec 2+ sources
Mediane : 3-5 sources par adcall
1

On fait deja passe-plat integral

Tous les external IDs recus sont forwardes aux partenaires. Les gains annonces par les providers (+20% CPM) partent d'un scenario ou on n'a rien โ€” ce n'est pas notre cas.

2

Biais corrige : on n'est pas en direct avec les DSP

Le DR supposait des connexions directes (Trade Desk, DV360...). En realite, on passe par des exchanges intermediaires. Seuls Criteo et LoopMe sont en direct. Ca invalide le "routage selectif par DSP".

3

ID5 couvre deja les cas critiques

ID5 (deja integre) enrichit les adcalls quand il n'y a rien d'autre. Pluguer UID2 en plus apporterait un gain marginal.

Ce qu'on ne fait PAS

Pas de nouveau S2S a pluguer Pas de modif schema BDD Pas besoin de devenir operateur UID2

Ce qu'on attend de vous

1
Demander aux partenaires : ont-ils un nombre max d'external IDs a recevoir ? Une whitelist de providers ? Est-ce negatif d'en envoyer 50 ? Bruno / Commercial
2
Identifier si un DSP majeur conditionne son spend sur un ID specifique โ€” Si oui, on integre cet ID en priorite, point final. Bruno
3
Continuer l'exploration Evron โ€” Relancer un test plus long (plusieurs jours, pas 1h) pour avoir des donnees significatives. Valider le GDPR cote Europe. Bruno + Yann

Le fil rouge : mesurer l'incremental

Le meme probleme revient dans les 3 sujets. On empile des fonctionnalites sans jamais mesurer leur impact individuel.

Attention KPI

"Est-ce que l'offer template rapporte quelque chose ?"

Tests Extremes

"Est-ce que le bouton a vraiment sauve l'editeur ?"

ID Externes

"Est-ce que forwarder 200 sources rapporte vs 5 ?"

On a besoin d'un systeme d'A/B testing capable d'isoler une variable (un provider, une offer template, un floor) et de mesurer l'impact sur le revenu avec significativite statistique.

C'est le sujet roadmap #7 โ€” Feature A/B Testing (SP-3628) qui conditionne la capacite de decision sur tous les autres.

Toutes les actions metier

Vue consolidee de ce qu'on attend de vous.

SujetActionResponsablePriorite
AttentionDevis Adelaide, Lumen, IASBruno / CommercialHaute
AttentionSonder 5 partenaires sur l'appetit attentionBruno / CommercialHaute
AttentionConfirmer usage = interne (offer templates)BrunoMoyenne
Tests ExtremesEvaluer le nombre d'editeurs sauvables + revenueAdel / BU PublisherHaute
Tests ExtremesDecider qui a acces au boutonAdel / MaxMoyenne
ID ExternesDemander aux partenaires leur politique external IDsBruno / CommercialHaute
ID ExternesIdentifier si un DSP conditionne son spend sur un IDBrunoMoyenne
ID ExternesRelancer test Evron (plusieurs jours)Bruno + YannBasse

Et apres ?

Maintenant
  • Actions metier ci-dessus
  • POC Tests Extremes (3j)
  • Monitoring external IDs
Apres vos retours
  • Go/no-go par sujet
  • Arbitrage budget attention
  • Decision Evron
S1 2026
  • Dev des sujets valides
  • Thompson Sampling (planif)
  • A/B Testing (sujet #7)

On ne lance aucun dev tant qu'on n'a pas les reponses a ces questions.
C'est le principe de la Phase 0 : valider avant de construire.

Roadmap 2026 โ€” Phase 0 Deep Research โ€ข Avril 2026 โ€ข Sujets : Attention KPI (Quentin), Tests Extremes (JF), ID Externes (Yann)

preview.smilewanted.com ยท main 8dd8738 ยท changelog