Home » Blogs en informatie » Generatieve AI versus realiteit: hoe verhouden virtuele pasbeurten zich tot echte content met modellen?

Generatieve AI versus realiteit: hoe verhouden virtuele pasbeurten zich tot echte content met modellen?

Generatieve AI is op de markt gekomen met een gewaagde belofte: de manier waarop modebeelden worden gemaakt opnieuw uitvinden door het proces sneller, goedkoper en eenvoudiger te maken. Voor een sector waar fotoshoots met echte modellen duur en tijdrovend kunnen zijn, klinkt dit bijna te mooi om waar te zijn. Maar kan AI daadwerkelijk de kwaliteit en authenticiteit van een echte fotoshoot evenaren?

Inhoudsopgave

AI-technologie in de mode-industrie
De testbasis
AI-tools testen: welke AI-beeldgenerator is het beste in het genereren van PDP-afbeeldingen voor mode?
Samenvatting van de resultaten
AI-tools testen: is het mogelijk om realistische video's te maken voor modecampagnes?
Kostenschatting: traditionele fotografie versus geautomatiseerde fotostudio versus generatieve AI
Resultaten
Samenvatting
Belangrijkste inzichten
Front view - JSON prompt

We hebben een professionele fotoshoot gedaan met een model én een etalagepop. We hebben deze shoot vervolgens vergeleken met een virtuele shoot met AI-modellen, gemaakt met de meest spraakmakende AI-tools van dit moment. Vier beeldgeneratoren, drie videogeneratoren en één realistische productfoto van een jurk op een etalagepop stonden centraal in het experiment. De uitdaging? Kijken hoe dicht AI bij de werkelijkheid kan komen.

Zal Nano Banana Pro de concurrentie op het gebied van AI-modefotografie overtreffen? In hoeverre vervormen of verbeteren deze tools het uiterlijk van producten en door AI gegenereerde modellen? En kunnen modemerken uiteindelijk vertrouwen op AI om de traditionele productie te vervangen?

De antwoorden zullen je misschien verrassen. Laten we beginnen!

AI-technologie in de mode-industrie

Dankzij AI-technologie is het tempo van fashionmarketing veranderd en is deze technologie meer dan ooit geïntegreerd in het creatieve proces. Merken vertrouwen nu op AI, niet alleen als ondersteuning, maar ook voor het genereren van beeldmateriaal voor zowel campagnemateriaal als productpagina’s (PDP’s). Deze verschuiving verandert de manier waarop fashionbeelden worden bedacht, geproduceerd en te gelde gemaakt.

Generatieve beeldmodellen en gespecialiseerde AI-workflows worden steeds meer afgestemd op gebruikssituaties in mode. Foto’s van modellen, merkspecifieke content en zelfs het automatisch genereren van advertenties zijn nu binnen enkele minuten mogelijk.

Wat de ‘modellen’ betreft, zoals aangegeven in een artikel van The Interline, genereren sommige AI-modellen realistisch ogende virtuele modellen en lifestyle-achtergronden, waardoor merken kledingstukken kunnen visualiseren op verschillende lichamen, achtergronden en scenario’s zonder een fysieke studio te hoeven boeken. Is er al een voorbeeld uit de industrie? Jazeker. H&M nam namelijk een zeer zichtbare stap om samen te werken met modellen en modellenbureaus om ‘digitale tweelingen’ te creëren. Dit zet een nieuwe norm op het gebied van rechten, vertegenwoordiging en hergebruik van modeluiterlijk. In hun initiatief behouden modellen het eigendom van hun digitale kopieën, worden ze hiervoor betaald en kunnen ze zelfs een licentie voor hun tweeling aan andere merken verkopen.
We weten dat merken al experimenteren met generatieve AI om content voor allerlei doeleinden te creëren, maar de content op de productdetailpagina (PDP) is een ander verhaal. Hier moeten beelden betrouwbaar, natuurgetrouw en van hoge kwaliteit zijn. Anders bestaat er een aanwezig risico dat er te veel wordt beloofd en te weinig wordt geleverd. Klanten kunnen iets ontvangen dat ver afstaat van wat ze hadden verwacht, wat de geloofwaardigheid van het merk schaadt en het aantal retourzendingen kan doen stijgen (en we weten al hoe groot dit probleem is in de e-commerce). Met andere woorden, een tool die bedoeld is om geld te besparen in een bepaald deel van de workflow, kan uiteindelijk ook schadelijk zijn voor bedrijven.

Daarom hebben we besloten om de mogelijkheden van AI in de mode-industrie te onderzoeken en deze te vergelijken met een echte fotoshoot.

💡 Wil je zien hoe AI reageert op het maken van lifestylefoto’s van parfums? Bekijk dan onze vorige blog: De stand van zaken van generatieve AI-technologie voor productfotografie: lifestylefoto’s van parfums maken met AI.

De testbasis

In ons vorige artikel over AI-technologie in lifestyle-parfumfotografie hebben we vijf verschillende AI-modellen/tools vergeleken en geprobeerd om met een eenvoudige prompt professionele resultaten te bereiken. Dit keer is de prompt echter geavanceerder; we hebben twee Orbitvu-oplossingen gebruikt om content te produceren en er zijn twee soorten foto’s: on-model (gemaakt in de Fashion studio als referentiebeelden/video’s) en packshots (gemaakt in Alphastudio XXL als bronbeelden voor generatieve AI).

Het doel is om dezelfde kwaliteit en authenticiteit te bereiken als de originele foto’s die in de Fashion studio zijn gemaakt, maar dan in het AI-proces.

Packshots en modelopnames

Ghost mannequin packshot gemaakt in Alphastudio XXL – vooraanzicht

Ghost mannequin packshot gemaakt in Alphastudio XXL – achteraanzicht

Modelfoto gemaakt in Fashion Studio – vooraanzicht

Modelfoto gemaakt in Fashion Studio – achteraanzicht

AI-tools: afbeeldingen en video

We zullen 4 populaire AI beeld-naar-beeldgeneratoren testen om twee modelbeelden te genereren op basis van twee bronafbeeldingen (voor- en achterkant). Vervolgens proberen we met de twee beste beelden en 3 state-of-the-art beeld-naar-videogeneratoren op de markt proberen de originele video na te maken.

Image-to-image AI-modellen:

Google Nano Banana Pro: Nano Banana is het AI-platform van de volgende generatie voor het genereren en bewerken van beelden (aangedreven door het Gemini 3.0 model van Google) waarmee je tekst in beelden kunt omzetten, foto’s met eenvoudige taal kunt bewerken, de visuele identiteit tijdens bewerkingen kunt behouden en meerdere beelden kunt samenvoegen. Het is allemaal ontworpen voor makers die behoefte hebben aan hoogwaardige en consistente beelden. Met de nieuwste update kunnen gebruikers afbeeldingen genereren met hogere resoluties, waaronder 2K en 4K, naast de standaardresolutie van 1K.
Flux Kontext [PRO]: Flux 1 Kontext is een AI-beeldmodel van de volgende generatie van Black Forest Labs dat tekstprompts en beeldinvoer combineert om beelden te creëren of te bewerken met een sterk besef van context, consistentie van objecten en karakters en het levert professionele output.
Seedream 4.0 van ByteDance: Seedream is het volgende generatie multifunctionele AI-beeldmodel. Het combineert genereren en bewerken, werkt met zowel tekst als afbeeldingen, ondersteunt meerdere referentie-input en levert snel beelden met ultrahoge resolutie. Dankzij de multifunctionele ‘redeneervaardigheden’ is het meer dan alleen een soort knutselprogramma. Het is bedoeld voor professionele workflows.
ChatGPT: De ChatGPT AI image creator is een functie die is ingebouwd in OpenAI’s ChatGPT en waarmee gebruikers afbeeldingen kunnen maken en bewerken met behulp van natuurlijke taal. Aangedreven door DALL-E 3, stelt het je in staat om gedetailleerde beelden rechtstreeks vanuit tekstprompts te genereren of bestaande afbeeldingen te wijzigen met eenvoudige instructies. ChatGPT is ook erg handig voor het maken van prompts en taakideeën.

AI-generatoren voor het omzetten van afbeeldingen naar video:

Veo3: Een tool van de volgende generatie AI voor het omzetten van tekst naar video en afbeeldingen naar video van Google. Hiermee kunnen gebruikers een tekstprompt invoeren (of optioneel referentieafbeeldingen) en automatisch korte filmpjes genereren met gesynchroniseerde audio, realistische bewegingen en een hoge visuele getrouwheid.
Kling AI: Een AI platform voor het genereren van video’s, ontwikkeld door Kuaishou Technology in China. Het ondersteunt het omzetten van tekstprompts (en zelfs statische afbeeldingen) in dynamische video’s met realistische bewegingen en een filmische stijl.
Speedance 1.0 PRO: Een geavanceerd AI-videogeneratiemodel ontwikkeld door ByteDance (de makers van TikTok). Het is gespecialiseerd in het omzetten van tekstprompts en statische afbeeldingen in hoogwaardige, filmische video’s (tot 1080p).

AI-tools testen: welke AI-beeldgenerator is het beste in het genereren van PDP-afbeeldingen voor mode?

Is het met de huidige vooruitgang in AI-technologie mogelijk om content te creëren die niet te veel afwijkt van de werkelijkheid? Zijn de onvolkomenheden die we zojuist zagen in elke gegenereerde afbeelding nog steeds zichtbaar? Laten we eens nader kijken naar de populaire AI-tools op de markt en nagaan of een goede packshot en een goede prompt een volledige fotoshoot voor e-commerce kunnen vervangen.

Aan de hand van de volgende criteria zullen de we AI-beelden evalueren:

Consistentie: Hoe consistent de eigenschappen van de jurk en het model worden afgebeeld op beide afbeeldingen die worden gegenereerd van de voor en achterkant.
Productgetrouwheid: Of de jurk natuurgetrouw wordt weergegeven op de AI-afbeelding. Er wordt gekeken naar kleuren, patronen, vorm en maat. Hoe realistisch valt het product op het model?
Kosten: Is het het geld waard?
Naleving van prompts: Worden alle instructies opgevolgd?

Vergelijking Nano Banana

Nano Banana Pro virtueel model

De echte foto’s gemaakt in de Fashion studio

Evaluatie

Consistentie en afwijkingen:
Hoewel het model in beide afbeeldingen hetzelfde lijkt, is er een duidelijk verschil in de algehele tint. De kleurtinten aan de achterkant zijn merkbaar anders dan de voorkant. Bovendien varieert de lengte van de jurk aanzienlijk, waarbij de achterkant een veel korter kledingstuk laat zien. Er zijn ook kleine, minder opvallende verschillen in de vorm van de schoenen.

Productgetrouwheid:
De gegenereerde afbeeldingen behouden over het algemeen een goede productgetrouwheid wat betreft het patroon, de algehele vorm en de stof van de jurk. Er zijn echter twee belangrijke onnauwkeurigheden:

De mouwvorm is onjuist weergegeven en lijkt veel kleiner dan bij het echte product.
Jurkmaat: De jurk is aan de achterkant iets te kort weergegeven in vergelijking met het daadwerkelijke product.

De kleur- en toonweergave zijn redelijk nauwkeurig in het vooraanzicht, maar niet in het achteraanzicht.

Naleving van de prompt:
De afbeeldingen volgen grotendeels de instructies. De enige afwijking is de achtergrondkleur, die lichtgrijs is in plaats van het gevraagde wit.

Kosten voor het genereren van afbeeldingen met Nanon Banana Pro:

1K-resolutie: €0,20 ($0,24) per afbeelding
2K-resolutie: €0,20 ($0,24) per afbeelding
4K-resolutie: tot €0,40 ($0,47) per afbeelding

Vergelijking Flux Kontext Pro

Flux Kontext Pro virtueel model

De echte foto’s gemaakt in de Fashion studio

Evaluatie

Consistentie en afwijkingen:
De witte achtergrond is strak en consistent in beide weergaven. Het algemene kleurenpallet en het bloemmotief worden ook consistent gehandhaafd. De afbeelding van de achterkant is echter iets te onderbelicht, met zichtbare schaduwen in het midden van de rug, wat de visuele consistentie beïnvloed. Bovendien verschillen de schoenen duidelijk tussen de foto’s, wat de visuele consistent verstoort.

Productgetrouwheid:

Flux Kontext Pro behoudt met succes het algemene silhouet, de juiste lengte van de jurk, het algemene kleurenpallet en het bloemenmotief van de jurk. De herkenbare combinatie van een dieprode achtergrond en felroze bloemenprint is behouden en er zijn geen duidelijke verschillen in het patroon zelf waarneembaar. Op het scherm zijn geen duidelijke verschillen in het patroon zelf waarneembaar. Op het scherm zijn geen duidelijke kleurinconsistenties zichtbaar, hoewel er wel subtiele variaties kunnen bestaan.

Belangrijke afwijkingen zijn echter dat de mouw te smal zijn gemaakt en dat de lengte van de rok in het achteraanzicht iets te kort lijkt.

Naleving van de prompt:

De witte achtergrond is correct gevolgd, wat bijdraagt aan een goede algehele presentatie. Het algemene pasconcept is succesvol uitgevoerd. Het model ziet er echter enigszins kunstmatig en plasticachtig uit, wat het realisme vermindert. Dit wijst op beperkingen wat betreft het bereiken van de gewenste fotorealistische kwaliteit die kenmerkend is voor productfotografie.

Kosten voor het genereren van Flux Kontext PRO afbeeldingen:

1K-resolutie: €0,10 ($0,12) per afbeelding
2K-resolutie: €0,15 ($0,18) per afbeelding
4K-resolutie: niet beschikbaar

Vergelijking Seedream 4.0

Seedream 4.0 virtueel model

De echte foto’s gemaakt in de Fashion studio

Evaluatie
Consistentie en afwijkingen:

Op de twee afbeeldingen worden verschillende schoenen gebruikt, wat de consistentie verstoort. Ook is het duidelijk zichtbaar dat de gezichten van de modellen verschillen, dat wijst op een gebrek aan continuïteit tussen de foto’s. De kleurtinten van de beelden verschillen ook van elkaar, waarbij de achterkant meer overeenkomt met de originele afbeelding.

Productgetrouwheid:

Seedream legt de herkenbare bloemenprint en het algehele kleurenpallet van de originele jurk vast, waardoor de visuele identiteit behouden blijft. Opvallend is dat alleen dit AI-model erin geslaagd is om de lange en wijde mouwen van de jurk te reproduceren.

Verschillende onnauwkeurigheden verminderen echter de getrouwheid:

De jurk is duidelijk te kort en de verhoudingen wijken af van het origineel, met name de vorm van de hals.
De drapering en structuur van de stof zijn niet helemaal overtuigend.

Het systeem slaagt er dus niet in om een één-op-één reproductie te maken, met name wat betreft de lengte, vorm, halslijn en het gedrag van de stof. Over het algemeen lijken beide afbeeldingen een te hoog contrast te hebben en lijst de jurk onderbelicht.

Naleving van de prompt:

De afbeeldingen zijn te donker en onvoldoende belicht, met name op de foto van het vooraanzicht, waardoor details van het kledingstuk onduidelijk zijn. Dit wijst erop dat de verlichtingsspecificaties in de prompt niet correct zijn opgevolgd. Over het algemeen levert Seedream een visueel aantrekkelijke AI-pasbeurt die het algemene concept weerspiegelt, maar de verlichting voldoet niet aan de gebruikelijke studio-packshotnormen.

Kosten voor het genereren van Seedream afbeeldingen:

1K-resolutie: niet beschikbaar
2K-resolutie: €0,08 ($0,09) per afbeelding
4K-resolutie: €0,08 ($0,09) per afbeelding

Vergelijking ChatGPT

ChatGPT virtueel model

De echte foto’s gemaakt in de Fashiom Studio

Evaluatie
Consistentie en afwijkingen:

De kleurweergave is veranderd en varieert tussen afbeeldingen, wat resulteert in opvallende verschillen in plaats van een consistent kleurenpalet in beide weergaven. Het model ziet er in beide weergaven aanzienlijk anders uit, inclusief het gezicht, het haar en de grootte.

Productgetrouwheid:

De door AI gegenereerde afbeeldingen behouden het algemene silhouet en bloemmotief van de originele jurk. Er zijn echter verschillen die de algehele getrouwheid verminderen:

De jurk is te kort in vergelijking met het origineel en de mouw lijkt te smal, wat de verhoudingen en pasvorm beïnvloedt.
De stof ziet er onnatuurlijk uit qua vorm en gedrag, vooral aan de voorkomt, waar de drapering en structuur niet overeenkomen met hoe de stof in werkelijkheid op het lichaam valt.
De kleurtinten wijken duidelijk af van het origineel.

Hoewel de AI-output het algemene idee van het ontwerp weergeeft, geeft deze niet volledig de authentieke look en constructie van het kledingstuk weer wat betreft lengte, mouwmaat, realisme van de stof en andere structurele details.

Naleving van de prompt:

Het algemene concept werd begrepen, maar de uitvoering wijst op beperkingen bij het bereiken van de gewenste fotorealistische kwaliteit en nauwkeurige weergave van kledingstukken die kenmerkend zijn voor productfotografie.

Kosten voor het genereren van ChatGPT afbeeldingen:

1K-resolutie: €0,12 ($0,14) per afbeelding
2K-resolutie: €0,40 ($0,47) per afbeelding
4K-resolutie: niet beschikbaar

Samenvatting van de resultaten

Onze keuze gaat uit naar Flux Kontext

Op basis van beeldkwaliteit, contextuele intelligentie en productiegereedheid presenteerde Flux Kontext duidelijk beter dan de andere geteste modellen. Dankzij zijn sterke punten op het gebied van realistische weergave van kledingstukken en consistente scène-generatie is het geschikt voor modecontent op grote schaal.

Daarom vormt Flux Kontext de basis voor AI-gestuurde videocreatie, waar consistentie en realisme van cruciaal belang zijn.

AI-tools testen: is het mogelijk om realistische video's te maken voor modecampagnes?

Nu we weten hoe AI-beeldgeneratoren presteren, gaan we kijken naar de mogelijkheden van video-AI-tools. We hebben de beste foto’s, laten we ze tot leven brengen.

Het doel van onze vergelijking is om te kijken hoe videogeneratietools omgaan met de taak om afbeeldingen om te zetten in video’s. We zullen ze beoordelen op:

Consistent voldoen aan de prompt: Het overeenstemmen van de bewegingen en timing van het model tegenover de bewegingen die ze uitvoert.
Getrouwheid: Of het model en de jurk die zijn gegenereerd op geen enkele manier worden gewijzigd op het gebied van textuur, kleuren of vorm.
Fysica: De plaatsing van het materiaal op het lichaam, de bewegingen van het model en de hoe natuurlijk de opname eruitziet.
Kosten: Is het de hype waard? Wat kost het?

Vergelijking Seedance 1.0 Pro

Evaluatie
Consistent voldoen aan de prompt:

Seedance volgde de instructies goed op en maakte geen opvallende fouten wat betreft het afstemmen van de bewegingen en timing van het model en de bewegingen die ze uitvoert.

Getrouwheid:

De jurk lijkt te zijn bewaard gebleven zonder wijzigingen in de textuur, kleuren of vorm. Het realisme schiet echter tekort. Wanneer het model zich omdraait is er een korte versnellingsfout waarneembaar, waardoor de video geen vloeiende beweging laat zien.

Fysica:

De video laat geen natuurlijke lichaamsbeweging zien, wat van invloed is op het gedrag van de stof van de jurk. Het haar ziet er tijdens de draaiing ook nep uit.

Kosten voor Seedance 1.0 Pro-videogeneratie:

Kosten voor Full HD kwaliteit: €1,55 ($1,81) per video van 8 seconden.

Vergelijking Veo3

Evaluatie

Consistent voldoen aan de prompt:

De bewegingen van het model zijn vrij goed en natuurlijk, wat suggereert dat de timing en bewegingen goed aansluiten bij wat er gevraagd werd.

Getrouwheid:

De tool kan de stof heel goed lezen. De kwaliteit van de jurk komt duidelijk naar voren in de opname. Dit laat zien dat de textuur en materiaaleigenschappen van het kledingstuk nauwkeurig zijn behouden tijdens het genereren.

Fysica:

Het draperen, kreuken en wapperen van de hangende sjerp is uitstekend en laat goed het natuurlijke gedrag van de stof zien. Echter is het haar niet in alle shots even realistisch, wat de natuurlijkheid van de hele video enigszins beïnvloedt.

Kosten voor Veo3-videogeneratie:

Kosten voor Full HD kwaliteit: €2,59 ($3,03) per video van 8 seconden.

Vergelijking Kling AI

Evaluatie

Authenticiteit:

Kling heeft veel potentieel. Het heeft de meest levendige en levensechte modelbewegingen, waardoor een zeer realistische weergave ontstaat. Echter is de overgang van het vooraanzicht naar het eindframe zeer onrealistisch. Dit zorgt ervoor dat de authenticiteit van de video wordt verstoord.

Consistent voldoen aan de prompt:

De modelbewegingen zijn levendig en zeer realistisch, wat wijst op een sterke afstemming op de gevraagde timing en acties.

Getrouwheid:

De jurk en het model lijken gedurende de hele video nauwkeurig te zijn weergegeven, zonder merkbare wijzigingen in het uiterlijk van het kledingstuk.

Fysica:

De fysica van de stof is zeer goed weergegeven, met een prachtig vallende jurk en natuurlijk bewegend haar. De video laat uitstekend natuurlijk gedrag zien van zowel het model als het materiaal.

Kosten voor Kling videogeneratie:

Kosten voor Full HD kwaliteit: €2,27 ($2,65) per video van 10 seconden.

Kostenschatting: traditionele fotografie versus geautomatiseerde fotostudio versus generatieve AI

Om kosten van generatieve AI te vergelijken met die van traditionele en geautomatiseerde fotostudio’s, zijn we uitgegaan van de volgende aannames:

Voor een traditionele fotostudio zijn we uitgegaan van een goed geoptimaliseerde fotostudio in eigen beheer. De fotograaf maakt twee packshots (ghost mannequin vooraanzicht en één detailfoto), vier foto’s met model en optionele videoclip. De personeelskosten omvatten ook een model, een visagist (deze kosten zijn wat lager omdat we ervan uitgaan dat zij met meerdere modellen tegelijk werkt) en een stylist. En een productiecapaciteit van 15 (met video’s) tot 25 (alleen afbeeldingen) outfits per dag.
Voor een geautomatiseerde fotostudio zijn we uitgegaan van Orbitvu Fashion studio, die wordt bediend door een stylist die twee packshots (ghost mannequin vooraanzicht en één detailfoto), vier foto’s met model en optioneel een videoclip maakt. De personeelskosten omvatten ook het model en de visagist. De productiecapaciteit is 30 – 40 producten per dag. Aangezien de Fashion studio in staat is om de foto’s en video’s tijdens het maken ook direct te bewerken. Hierdoor zijn er ook geen kosten voor nabewerking.
Voor generatieve AI-beelden gaan we ervan uit dat een interne fotograaf drie packshots van de mannequins maakt (voorkant, achterkant en detail). De voorkant en achterkant worden gebruikt om vier afbeeldingen op modellen te genereren en optioneel de videoclip. De prompt engineer/kwaliteitscontroleur controleert elke afbeelding op nauwkeurigheid en maakt de afbeeldingen indien nodig opnieuw. We gaan ervan uit dat 50% en video’s één extra keer opnieuw moet worden gegenereerd. Beelden worden gegenereerd met Flux en video’s met Veo 3. Het knelpunt in dit geval is niet de technologie om beelden te genereren, maar eerder de capaciteit van de prompt engineer/kwaliteitscontroleur. We gingen uit van 60 – 80 outfits per dag.
We zijn uitgegaan van de gemiddelde arbeidskosten in West-Europa.

Resultaten

Traditionele fotografie: topkwaliteit en unieke content

Het hangt allemaal af van hoe je studio werkt, of deze tegelijkertijd foto’s en video’s kan maken en hoe de processen zijn geoptimaliseerd. Volgens onze berekeningen bedragen de kosten per outfit naar schatting €69,25 ($81,00) voor foto’s en €122,25 ($143,00) inclusief video. Het voordeel van een traditionele fotostudio is dat de beelden echt uniek kunnen zijn, van de hoogste kwaliteit en bovendien natuurgetrouw.

Geautomatiseerde fotostudio (bijvoorbeeld Orbitvu Fashion Studio): hoog productievolume, realistische en consistente content

De Orbitvu fotostudio combineert het vastleggen van beelden en video’s, de nabewerking en publicatie in één enkel proces. Hierdoor wordt de productiecapaciteit gemaximaliseerd. Tegelijkertijd kan deze door iedereen worden bediend, niet alleen door een professionele fotograaf, dus ook door de stylist. Het zorgt voor een hoge beeldkwaliteit, consistentie en natuurgetrouwheid. We schatten de kosten voor outfits tussen €30,78 ($36,00) voor alleen foto’s en €51,29 ($60,00) voor video en foto.

Generatieve AI: snel, maar riskant

Generatieve AI-afbeeldingen vereisen invoerafbeeldingen, plat of op een paspop. We zijn uitgegaan van afbeeldingen op een paspop, omdat deze de kenmerken van kleding beter weergeven en daardoor beter zijn als invoer voor generatieve AI. Zoals verwacht, zijn de kosten voor AI-beeldgeneratie het laagst, variërend van €7,87 ($9,21) voor alleen foto’s tot €13,58 ($15,89) voor foto’s en video. Het nadeel, of beter gezegd het extra risico, is dat generatieve beelden alleen de werkelijkheid simuleren. Als de beelden te ver afwijken van het product, kunnen er extra kosten ontstaan door veel retouren en dit schaadt het merkimago.

Samenvatting

Generatieve AI verandert de manier waarop modecontent wordt gemaakt en biedt snellere en goedkopere alternatieve voor traditionele fotoshoots. Onze tests bevestigen dat AI al visueel overtuigende foto’s en modevideo’s kan produceren met packshots en goede prompts als input.

Geen van de resultaten werd echter bij de eerste poging al behaald. Voordat we een betrouwbare opstelling hadden gevonden, hebben we meerdere iteraties doorlopen om een effectieve prompt te ontwikkelen voor het genereren van zowel afbeeldingen als video’s van een model. De prompt moest worden ontworpen om bij deze specifieke jurk en het sjaaltje te passen. Kledingstukken met zeer specifieke details moeten op maat worden aangepast, wat de schaalbaarheid beperkt en de automatisering vermindert. Het belangrijkste is dat men bij het zien van de jurk in staat is om de prompt goed te ontwerpen. Pas nadat we de prompt hadden verfijnd konden we een gestructureerde reeks tests uitvoeren in de geselecteerde AI-tools. Hoewel de workflow eenvoudig lijkt, vereist deze in de praktijk tijd, ervaring en het verbruik van het aanzienlijk aantal credits voordat de gewenste resultaten worden bereikt.

Van de geteste tools presenteerde Flux Kontext het beste wat betreft het behoud van het algehele silhouet, de kleuren en het patroon van het kledingstuk. De belangrijkste beperkingen blijven bestaan in fijne details zoals de drapering van de stof, de precieze verhoudingen en de vorm (ook van de mouwen), de kleurconsistentie en de continuïteit tussen het voor- en achteraanzicht. Het was ook het enige model dat de kleurtinten intact hield wat cruciaal is voor e-commerce.

Zodra je over goede invoerafbeeldingen beschikt, bleek het genereren van video’s veelbelovend. Door AI-gegenereerde voor- en achteraanzicht afbeeldingen van Flux Kontext als begin- en eindframes te gebruiken, konden vloeiende en realistische modevideo’s worden gemaakt die lijken op de traditionele studio-opnames. Deze korte video’s kunnen een doorbraak betekenen voor e-commerce voor mode. Het kan namelijk paservaringen bieden die klanten helpen om met meer vertrouwen een aankoopbeslissing te nemen.

Belangrijkste inzichten

Hoogwaardige inputcontent voor generatieve AI is belangrijk. Details en kleuren worden door AI verwerkt en de gegenereerde resultaten kunnen nooit beter worden dan de originele afbeelding.
De schaalbaarheid van AI heeft zijn beperkingen. Als AI de informatie niet uit de ingevoerde afbeeldingen kan halen, zal hij het zelf bedenken. Het resultaat kan een afbeelding zijn van een min of meer ander product. Om alles onder controle te houden, zijn mensen nodig voor zowel kwaliteitscontrole als voor snelle interventie ter plaatse. Het is cruciaal dat de prompt engineer het echte kledingstuk kan zien, want alleen dan kunnen de afbeeldingen correct worden aangepast.
AI bespaart kosten en tijd bij fotoshoots van mode. Generatieve AI kan veel kosten besparen die verband houden met een fotoshoot, zoals een model, stylist en de fotograaf, maar moet je nog steeds foto’s nemen van het product zelf en geld uittrekken voor specialisten in AI. Zij zorgen voor de prompts en houden toezicht over het proces en handhaven de kwaliteit en authenticiteit van het product.
AI brengt risico’s met zich mee. Generatieve AI introduceert van nature hallucinaties in beeld. Hoogwaardige invoerbeelden en een goede kwaliteitscontrole kunnen deze risico’s beperken, maar niet volledig elimineren. Onbetrouwbare productcontent kunnen leiden tot ontevreden klanten, schade aan het merkimago en hogere retourkosten. De andere risico’s hebben betrekking op de modellen die met AI worden gegenereerd. In werkelijkheid zijn zij min of meer een mengeling van foto’s van echte mensen. Om juridische problemen te voorkomen, kan je overwegen een virtueel model (een zogenaamde digitale tweeling) in te huren en wat kosten per afbeelding toe te voegen.

Front view - JSON prompt

{

“scene_description”: {

“setting”: “studio photo shoot with a plain white background and bright, even lighting”,

“subject”: {

“type”: “person”,

“gender”: “female”,

“age_range”: “adult”,

“pose”: “standing with one hand on hip and the other arm relaxed”,

“expression”: “smiling, facing the camera”,

“hair”: {

“color”: “dark brown”,

“length”: “medium-long”,

“style”: “loose and natural”

}

“outfit”: {

“type”: “long patterned dress”,

“colors”: “warm tones with floral print”,

“footwear”: {

“type”: “open-toe heeled mules”,

“color”: “black”,

“material”: “smooth leather or leather-like finish”,

“heel_height”: “medium (approximately 5–7 cm)”,

“design_details”: “minimalist slip-on style with open back and narrow band across the toes”,

“overall_style”: “elegant and modern, complementing the dress without drawing attention away from it”

}

“composition”: {

“framing”: “full-body shot”,

“camera_angle”: “eye-level, straight-on”,

“background”: “plain white seamless backdrop”,

“lighting”: “soft, diffused, evenly distributed”

“overall_style”: {

“theme”: “fashion catalog or lookbook”,

“mood”: “confident, cheerful, elegant”

“additional_information”: {

“note”: “The sash or fabric piece that hangs down from the dress should be wrapped around the model’s neck like a choker or scarf for the intended styling.”

}

Backview – JSON prompt

{

“scene_description”: {

“setting”: “studio photo shoot with a plain white background and bright, even lighting”,

“subject”: {

“type”: “person”,

“gender”: “female”,

“age_range”: “adult”,

“pose”: “standing with back to the camera, head slightly turned to the side”,

“expression”: “neutral, calm”,

“hair”: {

“color”: “dark brown”,

“length”: “medium-long”,

“style”: “loose and natural”

}

“outfit”: {

“type”: “long patterned dress”,

“colors”: “warm tones with floral print”,

“footwear”: {

“type”: “open-toe heeled mules”,

“color”: “black”,

“material”: “smooth leather or leather-like finish”,

“heel_height”: “medium (approximately 5–7 cm)”,

“design_details”: “slip-on style with open back, single wide strap across the front, and thin stiletto-style heel”,

“overall_style”: “minimalist and elegant, complementing the outfit while keeping the focus on the dress”

}

“composition”: {

“framing”: “full-body shot from the back”,

“camera_angle”: “eye-level, straight-on”,

“background”: “plain white seamless backdrop”,

“lighting”: “soft and evenly distributed with minimal shadows”

“overall_style”: {

“theme”: “fashion catalog or lookbook”,

“mood”: “elegant, composed, confident”

}

“additional_information”: {

“note”: “The sash or belt seen hanging at the back of the dress should be styled by wrapping it around the model’s neck, creating a cohesive look that matches the front view.”

}

Video prompt

“Generate a 7-second fashion showcase video using the provided packshot image as the outfit reference.

The subject is a young woman standing naturally in front of a plain, neutral studio backdrop with soft, even lighting.

The camera remains static in a medium-to-full-body shot, keeping the focus entirely on the person and the outfit.

Movements should be smooth and natural, highlighting the outfit without distractions.

Timeline of actions:

– Seconds 0–2: The subject stands in a neutral pose with minimal movement.

– Seconds 2–4: She makes a small, natural motion, such as a subtle body turn or shifting her weight slightly.

– Seconds 4–6: The model rotates smoothly around her own axis to show the **back of the outfit**, turning naturally and gracefully.

– Seconds 6–7: She finishes in a clean ending pose, holding still before the video ends.

Style:

– Fashion showcase style

– Smooth tempo, no rapid cuts or transitions

– Clean studio look with emphasis on outfit clarity

– Outfit design and details must strictly follow the provided packshot image”

Dit onderzoek is uitgevoerd door het Orbitvu-team:

Packshots: Julia Banduch

Prompts, generatieve afbeeldingen en beschrijvingen: Marek Herceliński

Copywriting: Elżbieta Binkowska

Begeleiding en ondersteuning: Tomasz Bochenek

Generatieve AI versus realiteit: hoe verhouden virtuele pasbeurten zich tot echte content met modellen?

AI-technologie in de mode-industrie

De testbasis

Packshots en modelopnames

AI-tools: afbeeldingen en video

AI-tools testen: welke AI-beeldgenerator is het beste in het genereren van PDP-afbeeldingen voor mode?

Vergelijking Nano Banana

Vergelijking Flux Kontext Pro

Vergelijking Seedream 4.0

Vergelijking ChatGPT

Samenvatting van de resultaten

AI-tools testen: is het mogelijk om realistische video's te maken voor modecampagnes?

Vergelijking Seedance 1.0 Pro

Vergelijking Veo3

Vergelijking Kling AI

Kostenschatting: traditionele fotografie versus geautomatiseerde fotostudio versus generatieve AI

Resultaten

Samenvatting

Belangrijkste inzichten

Front view - JSON prompt

Benieuwd hoe een Orbitvu studio jouw contentcreatie kan versnellen?