Prenez un retailer mode avec 300 magasins et 300 M€ de chiffre d'affaires. Son budget marketing tourne autour de 7-8 % du CA, soit 20 à 24 millions d'euros par an. Ce budget est réparti entre la TV, le digital (Meta, Google, TikTok), le CRM (emailing, SMS), les promotions en magasin, l'affichage, et une dizaine d'autres leviers.
La question à 2 millions d'euros (littéralement) : est-ce que ces 20 M€ sont alloués au bon endroit ?
Personne ne le sait. Le directeur marketing a des intuitions. L'agence média a ses recommandations — qui, par hasard, favorisent toujours les canaux sur lesquels elle prend une commission. Google Analytics dit que le dernier clic vient du search. Meta dit que c'est grâce à Instagram. Et la TV ? Impossible à mesurer avec du last-click attribution.
C'est exactement le problème que résout le Marketing Mix Modeling (MMM). Un modèle statistique qui décompose le chiffre d'affaires en deux composantes : la part qui aurait existé sans aucun marketing (la « base »), et la contribution réelle de chaque levier. Avec, en bonus, des courbes de saturation qui montrent à partir de quel niveau d'investissement un euro supplémentaire sur un canal ne rapporte plus rien.
Les benchmarks des cabinets spécialisés (Ekimetrics, Converteo, Artefact, Nielsen) parlent de 10 à 15 % d'optimisation du budget marketing après un premier MMM. Sur 20 M€ de budget, ça fait 2 à 3 M€ mieux alloués par an. Pour un retailer mode dont les marges sont sous pression, c'est un projet qui change la donne.
Et pourtant, aucun retailer mode français n'a publiquement communiqué sur un déploiement MMM, que ce soit en interne ou via un cabinet. Cet article explique pourquoi, et comment construire un MMM en interne sur PyMC-Marketing pour un coût qui n'a rien à voir avec les 70 000 € minimum d'un cabinet.
Le problème : 70 000 € minimum chez un cabinet, 500 000 € pour un déploiement multi-pays
Quand un directeur marketing commence à explorer le sujet du MMM, la première chose qu'il fait, c'est de regarder ce qui existe sur le marché.
Les cabinets spécialisés en France se comptent sur les doigts d'une main :
- Ekimetrics : leader historique européen, seul acteur européen dans le Magic Quadrant Gartner Marketing Mix Modeling. Tickets typiques 70-150 k€/an pour un projet mono-marché, 300-500 k€/an pour du multi-marché.
- Converteo : approche industrialisée avec leur « MMM Factory ». Pricing comparable.
- Artefact : positionné comme partenaire Meridian de Google, avec une approche plus tech-savvy.
- Nielsen : historiquement très présent sur le CPG, moins sur le retail spécialisé.
- Fifty-five, Sia Partners : alternatives boutique, pricing variable.
Le ticket d'entrée est de 70 000 € par an minimum pour un projet MMM standard. C'est le chiffre que les cabinets eux-mêmes communiquent dans leurs interviews. Pour un déploiement multi-marchés (international) ou multi-pays, on monte facilement à 150-500 k€ la première année, avec un récurrent à 80-200 k€/an pour les ré-actualisations.
Pour une ETI mode avec 200-300 M€ de CA, ce budget est difficile à justifier en année 1. Le CFO veut voir un retour avant de signer un chèque à 6 chiffres pour un modèle statistique dont il ne comprend pas les mécanismes — et qu'il devra renouveler chaque année pour rester à jour.
Ce que personne ne vous dit sur la data retail fashion
Les articles de blog des cabinets (et il y en a des dizaines en français) suivent tous le même schéma : ils expliquent le concept, comparent Meridian de Google et Robyn de Meta, montrent un graphique de décomposition du CA, et terminent par un CTA vers leur page de démo.
Ce qu'aucun ne traite, c'est la réalité terrain d'un retailer mode. Trois sujets en particulier sont systématiquement ignorés.
Le halo digital-to-store
88 % du CA d'un retailer mode se fait en magasin physique. Quand un client voit une publicité Instagram le mardi et achète en boutique le samedi, le digital revendique zéro conversion (parce qu'il n'y a pas de tracking croisé) et le magasin revendique tout le CA — alors que sans la publicité Instagram, l'achat n'aurait peut-être pas eu lieu.
Comment modéliser cet effet de halo digital-to-store sur un réseau de 300 magasins ? Aucun article de référence en français ne traite ce sujet sérieusement. Les approches existantes (matched-market tests, geo-experiments, modélisation de l'influence avec lag) sont documentées dans la littérature CPG américaine mais inadaptées telles quelles au retail fashion européen.
C'est pourtant le sujet central : sans modélisation du halo, le MMM sous-estime systématiquement la contribution du digital et sur-estime celle des médias bas-funnel (CRM, retargeting, search). Les arbitrages budgétaires qui en découlent sont biaisés.
La saisonnalité mode est un cauchemar pour le MMM
Le retail fashion a une saisonnalité structurellement différente de tous les autres secteurs. Au lieu d'un cycle annuel régulier, vous avez :
- Collections printemps/été et automne/hiver avec lancements à dates variables
- Soldes d'hiver et d'été dont les dates changent chaque année selon le calendrier légal
- Men's Week, Black Friday, Cyber Monday avec des dynamiques très différentes
- Rentrée scolaire, Noël, Saint-Valentin, Fête des Mères avec leurs propres mécaniques marketing
- Capsules et drops sur des cycles plus courts (3-6 semaines)
Chaque événement a son propre mix marketing et ses propres dynamiques. Un modèle bayésien standard qui ne capture pas cette saisonnalité spécifique au prêt-à-porter va confondre l'effet « soldes » avec l'effet « budget Meta multiplié par 3 pendant les soldes » — et conclure à tort que Meta est ultra-efficace, alors que le levier réel était la mécanique soldes.
Modéliser proprement cette saisonnalité demande des features calendaires fines (jusqu'à 30-40 indicateurs sur 3 ans d'historique) et des priors bayésiens informés par la connaissance métier. Les cabinets le font, mais avec un effort de cadrage qui pèse sur le coût total.
Les promotions brouillent tout
Un retailer mode fait de la promo en continu : remises fidélité, ventes privées, codes promo, démarques progressives, soldes flash. Ces promotions ont un effet sur le CA qui se mélange avec l'effet des campagnes marketing.
Démêler les deux est la vraie difficulté technique du MMM retail fashion. Une campagne marketing pendant une période promo génère du CA, mais combien de ce CA aurait été là sans la campagne, juste à cause de la promo ? Et combien aurait été là sans la promo, juste à cause de la campagne ? Les modèles standards qui traitent prix et marketing comme des effets indépendants se trompent systématiquement sur ce sujet.
C'est un point que les articles sur le CPG (grande consommation alimentaire) ne couvrent pas du tout — leurs dynamiques sont complètement différentes (peu de promo, prix relativement stable, achats récurrents et planifiés).
Pourquoi PyMC-Marketing plutôt que Meridian ou Robyn
Le choix du framework open-source est devenu un sujet à part entière. Trois acteurs dominent le marché :
- Meridian (Google) : lancé en janvier 2025 avec une couverture presse massive. Tourne sur TensorFlow Probability.
- Robyn (Meta) : maintenu depuis 2020. Historiquement en R, avec une version Python beta traduite par LLM que la communauté considère encore instable.
- PyMC-Marketing (PyMC Labs) : framework bayésien pur en Python, l'écosystème scientifique de référence pour l'inférence bayésienne.
Pour une équipe data interne qui travaille déjà en Python et BigQuery (ou Snowflake/Databricks), le choix se fait assez naturellement sur PyMC-Marketing. Trois raisons.
L'écosystème Python natif
Meridian tourne sur TensorFlow Probability, ce qui implique une dépendance à l'écosystème TensorFlow qui n'est pas dans la stack data classique d'une PME/ETI. Robyn nécessite soit un environnement R (rare en data team moderne), soit une version Python beta encore fragile. PyMC-Marketing s'intègre nativement dans un workflow Python / BigQuery / dbt / Dagster — c'est-à-dire la modern data stack standard.
Cela peut sembler un détail technique, mais ça ne l'est pas. Quand le data scientist en interne a déjà un kernel Python connecté à BigQuery via SQLAlchemy ou bigframes, charger des données et entraîner un modèle PyMC prend 20 minutes. Avec Meridian sur TensorFlow Probability, il faut monter un environnement séparé, gérer les conflits de dépendances, et apprendre une API spécifique.
La flexibilité bayésienne et les priors informatifs
PyMC-Marketing permet d'injecter des priors informatifs — c'est-à-dire d'encoder votre connaissance métier directement dans le modèle.
Concrètement, si votre équipe média sait que :
- La TV a un effet retardé de 2-3 semaines (adstock TV)
- Le CRM email a un effet quasi-immédiat (adstock court)
- Le digital programmatique sature à partir de 200 k€/semaine
- La saisonnalité Noël fait +40 % de demande organique
… vous pouvez encoder ces convictions comme priors bayésiens. Le modèle les utilise comme point de départ, puis les ajuste avec les données. Si les données contredisent fortement vos priors, le modèle s'éloigne de vos convictions ; s'ils sont cohérents, le modèle converge plus vite et plus précisément.
Cette capacité est fondamentale en retail mode où on a des convictions fortes sur la saisonnalité et le comportement client, mais où l'historique de données est limité (3-4 ans souvent, parce que le retail digital moderne est récent). Un modèle non-bayésien (régression linéaire classique, ML pur) qui ne sait pas exploiter ces convictions métier va sur-fitter sur l'historique et donner des résultats fragiles.
Les benchmarks techniques
PyMC Labs a publié des comparatifs (en conflit d'intérêt évident, mais méthodologiquement solides) montrant une supériorité de PyMC-Marketing sur Meridian en termes de :
- SRMSE (Scaled Root Mean Squared Error) sur les prédictions hold-out
- CRPS (Continuous Ranked Probability Score) sur la qualité des intervalles de confiance
- Convergence MCMC plus stable sur des datasets de taille typique (3-5 ans hebdomadaires)
Ces métriques ne font pas tout, mais elles rassurent quand on doit défendre le choix technique en interne.
Le vrai TCO d'un MMM in-house
Voici les ordres de grandeur réels d'un projet MMM in-house pour un retailer mid-market :
- Data scientist senior à 30-50 % de son temps pendant 3-4 mois : ~25-35 k€ de coût chargé
- Infra cloud (BigQuery + compute pour l'entraînement) : ~300-500 €/mois
- Outillage : PyMC-Marketing (open-source, gratuit), Streamlit ou Metabase pour la restitution (gratuit ou marginal)
- Accompagnement externe (optionnel) : 5-10 jours d'expert pour le cadrage méthodologique : ~5-10 k€
Coût total année 1 : 30-50 k€ tout compris. C'est le prix d'un démarrage cabinet, mais avec trois différences fondamentales :
- Le modèle reste en interne. Vous gardez la propriété intellectuelle, la donnée ne sort pas, et vous comprenez ce qui tourne dans le moteur.
- L'équipe monte en compétence. Le data scientist qui a construit le MMM peut le maintenir et le faire évoluer sans dépendance externe.
- Les itérations suivantes sont quasi gratuites. Re-entraîner le modèle chaque trimestre prend quelques jours, pas plusieurs semaines de prestation.
Sur 3 ans, le différentiel de coût total est de l'ordre de 150-300 k€ d'économies vs cabinet — sans compter la valeur de l'autonomie acquise.
Les erreurs qu'on a faites (et que les cabinets ne documenteront jamais)
Il serait malhonnête de prétendre que tout est fluide. Voici les trois erreurs les plus fréquentes sur les projets MMM in-house — observées sur les déploiements documentés.
Erreur n°1 : sous-estimer le temps de préparation des données
Les benchmarks Circana (cabinet d'études retail) chiffrent à 35-45 % du temps projet la seule préparation des données. Beaucoup d'équipes data internes vivent exactement ça en démarrant un MMM.
Aligner dans un seul dataset propre :
- Les dépenses média par canal, par semaine, par région, par campagne
- Les ventes consolidées POS magasins + e-commerce + B2B (avec gestion des retours, transferts, échanges)
- La météo (les ventes mode sont fortement météo-sensibles : −15 % de CA un samedi pluvieux)
- Les promotions (taux de remise, mécanique, périmètre, communication associée)
- Les événements calendaires (soldes, Black Friday, Saint-Valentin, vacances scolaires par zone)
- Les données concurrentielles si disponibles (parts de voix média, intensité promo)
… prend largement plus de temps que prévu, surtout si la modern data stack n'est pas encore en place. C'est pourquoi un MMM in-house demande un investissement préalable en data engineering : sans data warehouse propre avec dbt et Airbyte, le projet patine pendant des mois sur la phase données.
Erreur n°2 : présenter le modèle comme une boîte noire au marketing
Les premières restitutions sont souvent trop techniques. « Le posterior de l'adstock TV montre une demi-vie de 2.3 semaines avec un intervalle de confiance à 95 % de [1.8, 2.9]. Le ROAS marginal du canal Meta dans la région IDF est de 1.42 avec un CRPS de 0.18… »
Le directeur marketing décroche à « posterior ». Le CFO décroche à « ROAS marginal ». Et le projet est perçu comme un délire de data scientist.
La traduction business demande un effort spécifique. Au lieu de « adstock TV de 2.3 semaines », dire : « la TV continue de générer des ventes pendant 2-3 semaines après la diffusion, ce qui veut dire que couper brutalement un flight TV coûte plus cher qu'on ne le pense — il faut amortir la décrue ». Au lieu de « ROAS marginal de 1.42 sur Meta », dire : « chaque euro additionnel investi sur Meta génère 1.42 € de CA, mais ce chiffre va baisser si on dépense plus — la courbe de saturation montre qu'on est déjà dans la zone de rendements décroissants au-delà de 800 k€/semaine ».
Cette traduction n'est pas du « simplisme commercial » — c'est ce qui transforme un modèle technique en outil de décision exécutable.
Erreur n°3 : ignorer la politique interne
Le MMM va inévitablement montrer que certains canaux sont sur-investis et d'autres sous-investis. L'agence média qui gère le canal sur-investi ne va pas accueillir cette nouvelle avec enthousiasme. Le directeur CRM qui découvre que son canal est en zone de saturation va contester la méthode. Le responsable TV qui voit son budget remis en cause va demander à voir les chiffres.
Cette politique interne doit être anticipée dès le cadrage du projet. Trois bonnes pratiques :
- Embarquer toutes les parties dès le début : agence média, équipes internes, finance. Pas pour qu'elles valident les conclusions, mais pour qu'elles comprennent la méthode et puissent challenger les hypothèses.
- Restituer en intervalle de confiance, pas en chiffre absolu : « la contribution Meta est entre 12 % et 17 % du CA » est plus défendable que « la contribution Meta est de 14.3 % ». Et c'est plus honnête.
- Positionner le MMM comme outil d'aide à la décision, pas comme oracle : la décision finale d'allocation budgétaire reste humaine, le modèle apporte des données pour informer cette décision.
Sans cette préparation politique, le MMM produit le bon résultat technique mais reste inutilisé par défense des intérêts particuliers.
Ce que ça change concrètement (sans les chiffres détaillés)
Sur les déploiements MMM documentés en retail mid-market, voici ce que le projet apporte concrètement :
Un langage commun entre marketing et finance
Avant le MMM, le marketing justifie ses budgets par des métriques propres à chaque canal (ROAS Google, CPM Meta, GRPs TV, taux d'ouverture email). Le CFO ne peut pas comparer un GRP à un CPM. Maintenant, chaque canal a une contribution au CA exprimée en euros, comparable directement.
C'est un changement majeur de gouvernance. Le comité marketing-finance peut enfin discuter d'arbitrages dans la même unité.
Des scénarios de simulation actionnables
« Si on réduit la TV de 20 % et qu'on réalloue sur le digital, que se passe-t-il ? » Avant, c'était une conversation d'opinions. Maintenant, c'est une simulation avec un intervalle de confiance : « cette réallocation devrait générer entre +1.2 % et +2.8 % de CA, avec une probabilité de 78 % d'être positive ».
Cette capacité de simulation transforme la discussion budgétaire annuelle. Au lieu de discuter en moyennes glissantes des historiques, on discute en projections de scénarios.
Une vision des rendements décroissants
Les courbes de saturation montrent que certains canaux sont dans la zone de rendements décroissants depuis longtemps — l'argent supplémentaire dépensé ne génère plus de CA additionnel significatif. C'est l'insight le plus actionnable : il ne s'agit pas toujours de dépenser plus, mais de dépenser mieux.
Sur les déploiements typiques, on identifie 1-2 canaux clairement sur-investis (zone de saturation) et 2-3 canaux sous-investis (potentiel de croissance non capturé). La réallocation entre ces deux groupes représente l'essentiel du gain.
Build vs. Buy : l'arbre de décision
Pour un retailer qui se pose la question, voici comment je structurerais la décision.
Externalisez chez un cabinet si :
- Vous n'avez pas de data scientist en interne capable de porter le projet
- Votre budget marketing dépasse 50 M€ (le ROI du cabinet se justifie rapidement)
- Vous avez besoin de résultats en moins de 3 mois
- Vous voulez un benchmark multi-marché ou multi-pays avec une méthodologie standardisée
- Le sujet est stratégique pour la direction générale et doit être porté par un acteur extérieur reconnu
Internalisez si :
- Vous avez au moins un data scientist Python senior (ou une équipe data engineer / analytics engineer mature)
- Votre budget marketing est entre 5 et 50 M€
- Vous voulez garder le contrôle et la propriété intellectuelle du modèle
- Vous êtes prêts à investir 4-6 mois avant les premiers résultats actionnables
- Vous prévoyez de ré-actualiser le MMM régulièrement (trimestriel ou semestriel)
L'option hybride (recommandée pour les ETI)
C'est généralement la voie la plus pragmatique pour les retailers mid-market :
- Démarrez en interne avec PyMC-Marketing
- Faites-vous accompagner ponctuellement par un expert externe pour le cadrage méthodologique (5-10 jours sur les 4 premières semaines)
- Itérez en interne ensuite
- Ré-engagez l'expert sur des sujets ponctuels (ajout d'un nouveau canal, intégration géo-experimentation, validation pré-budget annuel)
Coût total année 1 : 30-50 k€. Coût récurrent années suivantes : 10-20 k€ (compute + 2-3 jours d'expert par an si besoin). Comparé aux 70-200 k€/an d'un cabinet, l'économie cumulée sur 3 ans dépasse 200 k€ — sans compter l'autonomie acquise par l'équipe interne.
Le retail fashion français est un angle mort du MMM
Dernier point, et c'est ce qui mérite d'être souligné. Quand on regarde tout ce qui existe en français sur le MMM, les cas documentés concernent toujours les mêmes secteurs :
- CPG / grande consommation : Bonduelle, Nestlé, Danone (cas étudiés dans les articles Ekimetrics, Nielsen)
- Spiritueux et grande distribution : grands groupes étudiés via Harvard Business School et cabinets spécialisés
- Mobilité et tourisme : Pierre & Vacances, TGV Lyria, voyagistes
- Beauté / luxe : L'Oréal, marques sélectives via Ekimetrics
Le retail fashion français est totalement absent. Aucune enseigne mode mid-market n'a publiquement communiqué sur un déploiement MMM, que ce soit en interne ou via un cabinet. C'est un angle mort qui ne s'explique pas par un manque d'intérêt mais par la complexité spécifique du secteur :
- Le halo digital-to-store (88 % du CA en magasin)
- La saisonnalité mode (collections, soldes, Black Friday)
- Les promotions permanentes qui brouillent les signaux
… que les modèles CPG ne couvrent pas correctement.
Ce vide explique en partie pourquoi les retailers mode pilotent encore largement leur budget marketing à l'instinct ou aux KPI propres à chaque canal (ROAS Google, CPM Meta, GRPs TV) — sans vision unifiée de la contribution réelle.
Le MMM n'est pas réservé aux grands groupes CPG avec des budgets média de centaines de millions. Un retailer mode avec 20 M€ de budget marketing et un bon data scientist peut démarrer demain. PyMC-Marketing est mature, la documentation existe, et le ROI est typiquement atteint en 12-18 mois.
Le sujet n'est pas la techno — c'est la décision organisationnelle de traiter la donnée marketing comme un actif stratégique, et d'investir dans la capacité à exploiter cet actif en interne plutôt que de le sous-traiter en perpetuité à un cabinet.
Cet article est issu d'un retour d'expérience sur des projets MMM en retail fashion. Si vous voulez creuser le sujet sur votre propre activité — cadrage méthodologique, choix du framework, stratégie de déploiement in-house — parlons-en lors d'un workshop découverte.
Pour aller plus loin sur le pilotage CEO d'une marque e-commerce data-driven : le playbook complet du CEO e-commerce data-driven — Sézane, Burberry, Gymshark, Glossier et 7 autres marques décortiquées avec leurs chiffres réels.
