Le problème métier
Pour les collections saisonnières (Noël, été, événements thématiques), les équipes achats commandent à l'aveugle :
- Pas de données historiques fiables sur les nouveaux produits (la collection change chaque année)
- Pas de prédiction par référence — on commande sur la base d'intuitions et de ratios par catégorie
- Pas de simulation des scénarios de commande (« si je commande +20 % sur cette référence, qu'est-ce qui se passe ? »)
Conséquences chaque saison :
- Ruptures sur les best-sellers → CA perdu (les clients ne reviennent pas pour le même produit)
- Sur-stocks coûteux sur les flops → soldes à -50 %, puis vente aux soldeurs à 8-15 % du prix plein
- Marge structurellement érodée sur le périmètre saisonnier
Pour un retailer mode à 200-300 M€ de CA dont 30-50 % du catalogue est saisonnier, ces inefficiences se mesurent en plusieurs centaines de k€ à plusieurs M€ par an de marge laissée sur la table.
La solution
Un modèle ML qui prédit la quantité vendue par référence, avant ouverture de la collection, en combinant :
- L'historique des ventes sur les saisons précédentes (3 saisons minimum)
- Les attributs produits : matière, coupe, couleur, prix, catégorie, sous-catégorie
- Les attributs visuels générés par IA à partir de la photo du produit (style, motifs, complexité visuelle)
- Les commandes d'achat prévues comme variable d'entrée
- Les conditions externes : météo prévisionnelle, calendrier, événements
Le modèle apprend par analogie : un nouveau pull en cachemire camel ressemble à un pull cachemire écru de la saison N-1 + un pull camel laine de la saison N-2 → prédiction calibrée sur ces analogues.
L'acheteur récupère :
- Une fourchette de quantité à commander par référence avec intervalle de confiance
- Une simulation des scénarios : impact d'un changement de prix ou de volume de commande
- Une liste des références analogues qui ont nourri la prédiction (transparence)
L'acheteur garde la décision finale ; le modèle l'informe avec des données qu'il n'aurait pas pu calculer manuellement.
Comment estimer votre ROI
Le ROI a deux composantes principales que vous calculez séparément.
Composante 1 — CA capturé sur best-sellers (rupture évitée)
CA additionnel/an =
(CA actuel des best-sellers saisonniers en rupture)
× (% capture du modèle : 25-30 %)
Exemple pour un retailer dont les ruptures saisonnières représentent 1 M€ de CA perdu/an :
- Capture par le modèle : 30 % = +300 k€/an de CA additionnel
Composante 2 — Marge préservée sur flops (sur-stock évité)
Marge préservée/an =
(différence entre prix soldes magasin et prix de bradage soldeurs)
× (volume de flops mieux dimensionnés par le modèle)
Exemple pour un retailer écoulant 500 k€/an de stock résiduel chez les soldeurs (à 10 % du prix plein) au lieu de soldes magasin (60 % du prix plein) :
- Différentiel de 50 % de prix sur 500 k€ = 250 k€ de marge perdue/an
- Réduction par le modèle : 30 % = +75 k€/an de marge préservée
Total typique
Pour un retailer mode/textile à 200-300 M€ de CA avec un catalogue 30-50 % saisonnier, le ROI cumulé se situe typiquement entre 200 k€ et 500 k€/an d'impact net, à calibrer sur votre propre saisonnalité et historique de ruptures/invendus.
Phases de déploiement
| Phase | Durée | Livrable décisionnel |
|---|---|---|
| Cadrage | 2 sem | Audit historique 3 saisons, périmètre catalogue pilote, validation des features disponibles |
| V1 — Modèle baseline | 4-6 sem | Modèle entraîné sur 1 catégorie pilote, validation rétrospective sur la saison passée |
| V2 — Attributs visuels | 3-4 sem | Génération des features visuelles via IA, gain de précision sur le cold-start |
| Pilote saison | 4-8 sem | Test en condition réelle sur une vraie collection en parallèle des décisions humaines |
| Roll-out | Continu | Extension à toutes les catégories saisonnières, intégration outil acheteurs |
Quelles entreprises sont concernées
- Retailers avec un catalogue partiellement saisonnier (>20 % de références qui changent chaque saison)
- Au moins 3 saisons d'historique de ventes consolidé par référence
- Catégories à fort enjeu de prédiction : mode, textile, équipement saisonnier (sport, jardin), beauté thématique
- Volume de commandes : >2 M€ par saison sur le périmètre concerné
Moins pertinent pour : retailers à fond de catalogue stable (alimentaire, ameublement durable), retailers <50 M€ de CA (ROI marginal vs coût de mise en place), entreprises sans PIM structuré (priorité = construire le PIM avant le modèle).
Pièges à éviter
1. Sous-estimer la qualité de l'historique. Le modèle apprend sur 3 saisons précédentes. Si l'historique a des trous (ruptures non comptabilisées, retours non déduits, transferts inter-magasins non rapprochés), le modèle apprend du bruit. Plus pernicieux : si une saison passée a été affectée par un événement exceptionnel (Covid, rupture fournisseur, météo extrême), le modèle peut généraliser des patterns non reproductibles. Audit historique en amont indispensable, et flag des saisons « anormales » à traiter spécifiquement.
2. Vouloir un modèle universel. Tentation classique : un seul modèle pour toutes les catégories du catalogue. C'est rarement la meilleure approche — le pull en cachemire et le maillot de bain ont des dynamiques de demande très différentes (saisonnalité, élasticité, sensibilité météo). La séquence saine : un modèle par catégorie ou groupe de catégories homogènes, mutualisant l'infrastructure mais avec des features et calibrations spécifiques.
3. Ignorer le coût de la qualité d'attributs. Les attributs visuels générés par IA (style, motif, complexité, mood) demandent une infrastructure de Computer Vision et de tagging automatique. C'est puissant mais ce n'est pas trivial techniquement, et la qualité de ces features détermine 30-50 % de la précision du modèle sur le cold-start. Beaucoup d'équipes sous-estiment cette couche et finissent avec un modèle qui marche sur le « warm-start » mais pas sur les vraies nouveautés.
4. Négliger le change management côté acheteurs. Un acheteur expérimenté qui voit débarquer un algorithme « qui décide à sa place » va résister, consciemment ou non. La parade : impliquer les acheteurs dès la conception (choix des features, validation rétrospective), garantir la transparence du modèle (références analogues affichées), et positionner l'outil clairement comme aide à la décision (l'acheteur valide, ne suit pas aveuglément). Sans cela, le modèle est ignoré dans les 6 mois post-déploiement.
5. Mesurer la performance du modèle sans groupe témoin. Tentation : « le modèle a recommandé 1000 unités, on en a vendu 950, donc précision 95 % ». Mauvais calcul — peut-être que sans modèle on aurait commandé 1100 et vendu 1050 ! Pour mesurer rigoureusement le gain, il faut un protocole où une partie du catalogue passe par le modèle et une partie passe par la décision humaine seule, sur des références comparables. C'est ce qui permet de chiffrer la valeur incrémentale du modèle, pas juste sa précision absolue.
