Maxime Patte (Veesual) : « L’IA générative, une promesse incroyable pour les retailers »

ChatGPT a relancé l’engouement du plus grand nombre à l’égard de l’intelligence artificielle (IA), en particulier générative. Les applications sont multiples dans le secteur du retail, en témoignent les innovations portées par la start-up Veesual qui crée des expériences d’essayage virtuel pour le e-commerce de mode. Actu Retail a pu interroger son co-fondateur et CEO, Maxime Patte.

D’où vient le concept Veesual ? Pourquoi avoir souhaité créer une expérience d’essayage virtuel ?

Maxime Patte : Cela a été un cheminement de long cours. Beaucoup de marques essaient de faire vivre à leurs clients une expérience unique sur leur site e-commerce. Le problème est que tous ces sites ont la même structure, articulée autour d’une page d’accueil, de pages catégories, de pages produits, etc. Dans cette configuration, les images sont le seul moyen qu’ont les consommateurs pour se projeter en ligne. Ces images ont donc particulièrement été travaillées ces cinq dernières années, devenant de plus en plus inspirationnelles avec des mannequins aux poses singulières, voire des photos très « lifestyle » qui s’apparentent à celles que l’on retrouve dans les magazines. 

Or plus la photo devient « lifestyle » et inspirationnelle, moins elle va aider le consommateur à se projeter dans la réalité de ce qu’il achète. Un chiffre est assez marquant : la taille moyenne des mannequins femmes sur les fiches produits se situe entre 1,75 et 1,80 mètre, alors que celle des acheteuses françaises est de 1,63 mètre. Il existe un vrai décalage entre le contenu que les marques diffusent et ce à quoi les consommateurs peuvent s’identifier. 

Avec l’essor de l’IA générative, on a cherché à rendre le contenu des sites moins statique. Aujourd’hui, quel que soit le shopper qui se connecte, il va accéder aux mêmes images – en l’occurrence aux mêmes mannequins qui portent le même look. La probabilité que le consommateur s’identifie au mannequin est très faible, que ce soit pour les femmes ou pour les hommes.

De plus, quand on achète des vêtements, ce n’est pas pour les porter à une unique occasion. Cela peut aussi bien être en journée pour le boulot, que le soir en afterwork, etc. L’expérience e-commerce s’est pourtant construite jusqu’à présent sur la mise en avant d’un seul look, porté par un unique mannequin. En interrogeant les consommateurs, nous nous sommes rendu compte que c’est assez limitant en termes d’expérience.

Cela se vérifie dans les chiffres, puisque les taux de conversion stagnent en moyenne entre 1,5 et 2 % sur les sites e-commerce, voire entre 0,8 et 1,2 % pour les marques de luxe. En parallèle, les taux de retour en France représentent en moyenne 27 % des achats et peuvent grimper jusque 50 % pour certaines catégories, comme les pantalons. Tout cela implique un coût financier énorme pour les marques, ainsi qu’un coût environnemental élevé pour la planète.

Dans ce contexte, l’IA générative permet de rendre dynamiques les contenus affichés sur les sites – et non plus statiques. Pour cela, on donne la main au consommateur qui peut choisir un mannequin auquel il s’identifie. C’est l’occasion pour les marques de présenter une diversité de mannequins en termes de morphologie, de couleur de peau et d’âge. Cela n’a pas de sens de continuer à sélectionner des mannequins qui ont 20 ans alors que l’âge moyen de vos clients se trouve entre 30 et 40 ans ! Les marques peuvent ainsi témoigner d’une démarche plus inclusive, tout en offrant aux consommateurs la possibilité de devenir leur propre styliste.

Nous aidons les consommateurs à répondre à deux questions clés lorsqu’ils achètent des vêtements en ligne : est-ce que cela va m’aller ? et avec quoi cela va aller ? Grâce à notre technologie d’essayage virtuel, les marques proposent de nouvelles expériences permettant à leurs consommateurs de mieux s’approprier leurs collections en ligne et de mieux se projeter. 

Lorsque l’on entre dans un magasin, on peut toucher, voir de ses propres yeux l’intégralité de l’offre disponible. A contrario, la navigation sur une page internet classique n’est jusqu’ici pas ou peu interactive ni émotionnelle, et c’est encore pire sur mobile. Nous souhaitons offrir une meilleure expérience aux consommateurs en leur donnant la main sur les mannequins et les looks, afin de les aider à se projeter plus facilement.

Vous proposez donc des approches différentes : voir un même look mais sur des mannequins différents, ou bien changer de look sur un même mannequin. Vous offrez également la possibilité au consommateur d’essayer des looks sur leur propre image. Pouvez-vous préciser ces différentes approches ?

Maxime Patte : Prenons l’exemple du site de La Redoute, enseigne avec qui nous avons développé une « styling experience ». Celle-ci a deux grandes fonctionnalités. La première est de choisir un mannequin auquel s’identifier – parmi une sélection de six mannequins en l’occurrence. Une fois le mannequin sélectionné, le client peut créer son propre look au travers d’une seconde fonctionnalité que nous avons appelée « mix & match ». Ces deux fonctionnalités sont donc réunies dans une unique expérience, à savoir la « styling experience ». 

Nous avons un autre produit, le « switch model », qui permet de voir un même produit sur différents mannequins. Une robe portée par un mannequin de taille 40 lui arrivera au-dessus des genoux, alors que ce sera bien en dessous des genoux pour un autre de taille 38. Le client peut choisir en connaissance de cause et ajouter la taille qui lui convient à son panier. Notre technologie permet d’adapter de façon automatisée les vêtements à la taille du mannequin. Grâce à celle-ci, la marque peut enrichir son parcours client avec ce type d’expériences.

Votre ambition est-elle de proposer ces expériences sur des pages dédiées ou directement sur les pages produits ?

Maxime Patte : Nous avons commencé avec des pages dédiées pour plusieurs raisons. D’abord pour un enjeu de facilité d’intégration sur le site des marques. Il est bien plus facile de s’intégrer sur une page dédiée plutôt que sur une page existante. Pour les marques ensuite, c’est une façon de tester et de prouver la valeur apportée avant un déploiement sur les pages produits en elles-mêmes. 

Une fois que nous avons dépassé le stade de la preuve de concept, les marques nous demandent d’elles-mêmes d’aller plus loin et de nous intégrer plus en amont dans le parcours client. À terme, l’idée est que le « mix & match » puisse remplacer les pages catégories. Une telle navigation permet de défiler des dizaines de looks par session, ce qui engendre des taux de conversion exceptionnels. S’agissant des pages produits elles-mêmes, l’objectif serait de pouvoir suggérer différents looks à partir d’une même pièce ou de la montrer portée par des mannequins de diverses morphologies. 

Tout ce travail est réalisé sur des mannequins professionnels, shootés en studio par les marques. C’est important pour elles, car le casting fait partie intégrante de leur stratégie de branding déployée depuis une quinzaine d’années. Nous leur demandons simplement de « caster » une plus grande diversité de mannequins, pour avoir un panel suffisant de morphologies différentes.

Et pour la fin de l’année, nous travaillons sur le lancement d’une nouvelle expérience, vraiment spéciale. Il s’agira d’un essayage virtuel directement à partir d’une photo d’un consommateur, prise chez soi devant un miroir ou à l’aide d’une tierce personne. Nous demanderons des photos avec des habits de sport près du corps, ce qui nous permettra de projeter des looks directement sur leur silhouette.

Notre particularité est de prendre en compte la grille de tailles des marques. Pour chaque produit, les marques nous indiquent ses proportions en taille XS, S, M, L, etc. Cela nous permet, au moment de l’essai virtuel, de projeter un rendu extrêmement fidèle à la réalité. Cela a requis deux années de R&D pour générer de telles images. Les autres essayages virtuels, proposés sur le marché, vont généralement prendre un vêtement et le caler au niveau des épaules, sans que cela ne corresponde à la réalité. Notre souhait est d’avoir un niveau d’expérience le plus précis possible. 

Enfin, pour l’année prochaine, nous prévoyons un autre cas d’usage qui permettra au consommateur de paramétrer un avatar sur le site d’une marque, en détaillant ses caractéristiques physiques – taille, poids, morphologie. Le client pourra alors essayer des vêtements directement sur cet avatar.  

Quand l’on parle d’IA générative, on pense instinctivement à ChatGPT. Vos briques technologiques y sont-elles liées ?

Maxime Patte : L’histoire de Veesual a commencé en 2020 et, à l’époque, nous développions des suites algorithmiques basées sur de l’IA générative, non pas en Large Language Model (LLM) tel que ChatGPT mais sur des réseaux adverses génératifs (generative adversarial networks ou GAN). Nous avons développé cela pendant un an, puis nous nous sommes rendu compte que cela allait être extrêmement coûteux, chronophage et peu sûr.

Aujourd’hui, nous demandons aux marques de nous faire parvenir un nombre relativement restreint d’images, à partir desquelles nous réalisons toutes les combinaisons de looks possibles. Par exemple, si une marque à mille produits, nous demanderons une photo pour chacun d’entre eux. Et sur cette base, nous générons les dizaines de millions de looks potentiels. 

Nous avons mis au point notre propre moteur de génération d’images. C’est un système qui s’inspire de l’IA générative, puisque nous nous fondons sur un contenu existant pour créer des images uniques. En revanche, cela ne relève pas d’un LLM à la ChatGPT ni d’un GAN stricto sensu. L’IA générative est, par nature, très forte pour créer du contenu complètement synthétique et complètement nouveau. Mais il lui est plus difficile de respecter un contenu existant. Pour une marque, il n’est pas acceptable qu’un bouton blanc apparaisse en noir. C’est pour cela que nous avons développé notre propre moteur 100 % en interne, pour respecter précisément le vêtement que nous communique une marque. 

Avez-vous des indicateurs de performance relatifs à l’essayage virtuel ?

Maxime Patte : Oui, nous arrivons à prouver notre retour sur investissement. C’est indispensable aujourd’hui dans un monde qui souffre comme celui de la fashion française. Notre premier impact est social, puisque nous rendons le e-commerce plus inclusif. Les consommateurs expriment dans les études clients le fait que les mannequins actuels ne les représentent pas. En cela, Veesual répond à une attente client longtemps inassouvie. Ceci est quantifié par nos propres clients que sont La Redoute, Jules et Gémo.

De plus, les marques avec lesquelles nous travaillons ont pu faire des comparaisons entre les clients qui interagissent avec nos expériences et ceux qui ne le font pas. Il en ressort que, sur le prêt-à-porter féminin, le taux de conversion augmente de 20 à 55 % selon les catégories de produits. On parle d’une augmentation 20 % pour les chemises et tee-shirts, de 50 % pour les robes et les vestes et de 55 % pour les pantalons.

En termes de panier moyen, il y a aussi un impact car la navigation est rendue tellement simple entre les catégories de produits que le consommateur est amené à découvrir davantage de vêtements. On parle ici d’une augmentation de 20 % du panier moyen chez les femmes. Pour la mode masculine, il est plutôt question d’une augmentation de 45 % du panier moyen et de 30 % du taux de conversion. Tous les voyants sont au vert.

Sentez-vous un fort engouement des retailers sur ces sujets d’intelligence artificielle ?

Maxime Patte : Cela fait maintenant des années que l’IA est utilisée dans le retail, notamment sur des problématiques de prévision des stocks, de recommandations, etc. Il est important de préciser de quoi parle-t-on. En matière d’IA générative, je pense que le potentiel est incroyable. Dire à des marques qu’elles vont pouvoir proposer du contenu personnalisé en temps réel à partir d’une collection existante, cela enthousiasme tout le monde. Pour autant, il y a bien sûr un fossé entre cette promesse et la qualité des images pouvant être générées.  Beaucoup de marques nous disent avoir testé Midjourney ou Dall-e sur leurs propres produits, ce qui a donné des vêtements altérés voire des mannequins à six doigts. Il y a un fossé entre ce que les gens imaginent et ce que l’IA générative peut réellement faire.

Chez Veesual, nos process ont été pensés dès l’origine pour répondre au niveau d’exigence des marques. C’est important car celles-ci souffrent en France et préfèrent parfois s’engager sur des projets « ROIstes », plus court-termistes. Elles ont aussi été échaudées par la vague du métavers, qui de mon point de vue n’a duré que dix-huit mois.

La question est : pour quel cas d’usage précis souhaite-t-on recourir à de l’IA générative ? Cette réflexion ne se mène pas du jour au lendemain. Tout notre challenge est de transformer une technologie hyper enthousiasmante en un produit que les marques seront prêtes à utiliser au quotidien. Et cela prend plusieurs mois, voire plusieurs années.

Keep Exploring
Logo Franprix
Franprix propose l’arrondi en caisse au profit d’Habitat et Humanisme