Generatieve AI is op de markt gekomen met een gewaagde belofte: de manier waarop modebeelden worden gemaakt opnieuw uitvinden door het proces sneller, goedkoper en eenvoudiger te maken. Voor een sector waar fotoshoots met echte modellen duur en tijdrovend kunnen zijn, klinkt dit bijna te mooi om waar te zijn. Maar kan AI daadwerkelijk de kwaliteit en authenticiteit van een echte fotoshoot evenaren?
InhoudsopgaveWe hebben een professionele fotoshoot gedaan met een model én een etalagepop. We hebben deze shoot vervolgens vergeleken met een virtuele shoot met AI-modellen, gemaakt met de meest spraakmakende AI-tools van dit moment. Vier beeldgeneratoren, drie videogeneratoren en één realistische productfoto van een jurk op een etalagepop stonden centraal in het experiment. De uitdaging? Kijken hoe dicht AI bij de werkelijkheid kan komen.
Zal Nano Banana Pro de concurrentie op het gebied van AI-modefotografie overtreffen? In hoeverre vervormen of verbeteren deze tools het uiterlijk van producten en door AI gegenereerde modellen? En kunnen modemerken uiteindelijk vertrouwen op AI om de traditionele productie te vervangen?
De antwoorden zullen je misschien verrassen. Laten we beginnen!
Dankzij AI-technologie is het tempo van fashionmarketing veranderd en is deze technologie meer dan ooit geïntegreerd in het creatieve proces. Merken vertrouwen nu op AI, niet alleen als ondersteuning, maar ook voor het genereren van beeldmateriaal voor zowel campagnemateriaal als productpagina’s (PDP’s). Deze verschuiving verandert de manier waarop fashionbeelden worden bedacht, geproduceerd en te gelde gemaakt.
Generatieve beeldmodellen en gespecialiseerde AI-workflows worden steeds meer afgestemd op gebruikssituaties in mode. Foto’s van modellen, merkspecifieke content en zelfs het automatisch genereren van advertenties zijn nu binnen enkele minuten mogelijk.
Wat de ‘modellen’ betreft, zoals aangegeven in een artikel van The Interline, genereren sommige AI-modellen realistisch ogende virtuele modellen en lifestyle-achtergronden, waardoor merken kledingstukken kunnen visualiseren op verschillende lichamen, achtergronden en scenario’s zonder een fysieke studio te hoeven boeken. Is er al een voorbeeld uit de industrie? Jazeker. H&M nam namelijk een zeer zichtbare stap om samen te werken met modellen en modellenbureaus om ‘digitale tweelingen’ te creëren. Dit zet een nieuwe norm op het gebied van rechten, vertegenwoordiging en hergebruik van modeluiterlijk. In hun initiatief behouden modellen het eigendom van hun digitale kopieën, worden ze hiervoor betaald en kunnen ze zelfs een licentie voor hun tweeling aan andere merken verkopen.
We weten dat merken al experimenteren met generatieve AI om content voor allerlei doeleinden te creëren, maar de content op de productdetailpagina (PDP) is een ander verhaal. Hier moeten beelden betrouwbaar, natuurgetrouw en van hoge kwaliteit zijn. Anders bestaat er een aanwezig risico dat er te veel wordt beloofd en te weinig wordt geleverd. Klanten kunnen iets ontvangen dat ver afstaat van wat ze hadden verwacht, wat de geloofwaardigheid van het merk schaadt en het aantal retourzendingen kan doen stijgen (en we weten al hoe groot dit probleem is in de e-commerce). Met andere woorden, een tool die bedoeld is om geld te besparen in een bepaald deel van de workflow, kan uiteindelijk ook schadelijk zijn voor bedrijven.
Daarom hebben we besloten om de mogelijkheden van AI in de mode-industrie te onderzoeken en deze te vergelijken met een echte fotoshoot.
💡 Wil je zien hoe AI reageert op het maken van lifestylefoto’s van parfums? Bekijk dan onze vorige blog: De stand van zaken van generatieve AI-technologie voor productfotografie: lifestylefoto’s van parfums maken met AI.
In ons vorige artikel over AI-technologie in lifestyle-parfumfotografie hebben we vijf verschillende AI-modellen/tools vergeleken en geprobeerd om met een eenvoudige prompt professionele resultaten te bereiken. Dit keer is de prompt echter geavanceerder; we hebben twee Orbitvu-oplossingen gebruikt om content te produceren en er zijn twee soorten foto’s: on-model (gemaakt in de Fashion studio als referentiebeelden/video’s) en packshots (gemaakt in Alphastudio XXL als bronbeelden voor generatieve AI).
Het doel is om dezelfde kwaliteit en authenticiteit te bereiken als de originele foto’s die in de Fashion studio zijn gemaakt, maar dan in het AI-proces.

Ghost mannequin packshot gemaakt in Alphastudio XXL – vooraanzicht

Ghost mannequin packshot gemaakt in Alphastudio XXL – achteraanzicht

Modelfoto gemaakt in Fashion Studio – vooraanzicht

Modelfoto gemaakt in Fashion Studio – achteraanzicht
We zullen 4 populaire AI beeld-naar-beeldgeneratoren testen om twee modelbeelden te genereren op basis van twee bronafbeeldingen (voor- en achterkant). Vervolgens proberen we met de twee beste beelden en 3 state-of-the-art beeld-naar-videogeneratoren op de markt proberen de originele video na te maken.
Image-to-image AI-modellen:
AI-generatoren voor het omzetten van afbeeldingen naar video:
Is het met de huidige vooruitgang in AI-technologie mogelijk om content te creëren die niet te veel afwijkt van de werkelijkheid? Zijn de onvolkomenheden die we zojuist zagen in elke gegenereerde afbeelding nog steeds zichtbaar? Laten we eens nader kijken naar de populaire AI-tools op de markt en nagaan of een goede packshot en een goede prompt een volledige fotoshoot voor e-commerce kunnen vervangen.
Aan de hand van de volgende criteria zullen de we AI-beelden evalueren:

Nano Banana Pro virtueel model

De echte foto’s gemaakt in de Fashion studio
Evaluatie
Consistentie en afwijkingen:
Hoewel het model in beide afbeeldingen hetzelfde lijkt, is er een duidelijk verschil in de algehele tint. De kleurtinten aan de achterkant zijn merkbaar anders dan de voorkant. Bovendien varieert de lengte van de jurk aanzienlijk, waarbij de achterkant een veel korter kledingstuk laat zien. Er zijn ook kleine, minder opvallende verschillen in de vorm van de schoenen.
Productgetrouwheid:
De gegenereerde afbeeldingen behouden over het algemeen een goede productgetrouwheid wat betreft het patroon, de algehele vorm en de stof van de jurk. Er zijn echter twee belangrijke onnauwkeurigheden:
De kleur- en toonweergave zijn redelijk nauwkeurig in het vooraanzicht, maar niet in het achteraanzicht.
Naleving van de prompt:
De afbeeldingen volgen grotendeels de instructies. De enige afwijking is de achtergrondkleur, die lichtgrijs is in plaats van het gevraagde wit.
Kosten voor het genereren van afbeeldingen met Nanon Banana Pro:


Flux Kontext Pro virtueel model

De echte foto’s gemaakt in de Fashion studio
Evaluatie
Consistentie en afwijkingen:
De witte achtergrond is strak en consistent in beide weergaven. Het algemene kleurenpallet en het bloemmotief worden ook consistent gehandhaafd. De afbeelding van de achterkant is echter iets te onderbelicht, met zichtbare schaduwen in het midden van de rug, wat de visuele consistentie beïnvloed. Bovendien verschillen de schoenen duidelijk tussen de foto’s, wat de visuele consistent verstoort.
Productgetrouwheid:
Flux Kontext Pro behoudt met succes het algemene silhouet, de juiste lengte van de jurk, het algemene kleurenpallet en het bloemenmotief van de jurk. De herkenbare combinatie van een dieprode achtergrond en felroze bloemenprint is behouden en er zijn geen duidelijke verschillen in het patroon zelf waarneembaar. Op het scherm zijn geen duidelijke verschillen in het patroon zelf waarneembaar. Op het scherm zijn geen duidelijke kleurinconsistenties zichtbaar, hoewel er wel subtiele variaties kunnen bestaan.
Belangrijke afwijkingen zijn echter dat de mouw te smal zijn gemaakt en dat de lengte van de rok in het achteraanzicht iets te kort lijkt.
Naleving van de prompt:
De witte achtergrond is correct gevolgd, wat bijdraagt aan een goede algehele presentatie. Het algemene pasconcept is succesvol uitgevoerd. Het model ziet er echter enigszins kunstmatig en plasticachtig uit, wat het realisme vermindert. Dit wijst op beperkingen wat betreft het bereiken van de gewenste fotorealistische kwaliteit die kenmerkend is voor productfotografie.
Kosten voor het genereren van Flux Kontext PRO afbeeldingen:


Seedream 4.0 virtueel model

De echte foto’s gemaakt in de Fashion studio
Evaluatie
Consistentie en afwijkingen:
Op de twee afbeeldingen worden verschillende schoenen gebruikt, wat de consistentie verstoort. Ook is het duidelijk zichtbaar dat de gezichten van de modellen verschillen, dat wijst op een gebrek aan continuïteit tussen de foto’s. De kleurtinten van de beelden verschillen ook van elkaar, waarbij de achterkant meer overeenkomt met de originele afbeelding.
Productgetrouwheid:
Seedream legt de herkenbare bloemenprint en het algehele kleurenpallet van de originele jurk vast, waardoor de visuele identiteit behouden blijft. Opvallend is dat alleen dit AI-model erin geslaagd is om de lange en wijde mouwen van de jurk te reproduceren.
Verschillende onnauwkeurigheden verminderen echter de getrouwheid:
Het systeem slaagt er dus niet in om een één-op-één reproductie te maken, met name wat betreft de lengte, vorm, halslijn en het gedrag van de stof. Over het algemeen lijken beide afbeeldingen een te hoog contrast te hebben en lijst de jurk onderbelicht.
Naleving van de prompt:
De afbeeldingen zijn te donker en onvoldoende belicht, met name op de foto van het vooraanzicht, waardoor details van het kledingstuk onduidelijk zijn. Dit wijst erop dat de verlichtingsspecificaties in de prompt niet correct zijn opgevolgd. Over het algemeen levert Seedream een visueel aantrekkelijke AI-pasbeurt die het algemene concept weerspiegelt, maar de verlichting voldoet niet aan de gebruikelijke studio-packshotnormen.
Kosten voor het genereren van Seedream afbeeldingen:


ChatGPT virtueel model

De echte foto’s gemaakt in de Fashiom Studio
Evaluatie
Consistentie en afwijkingen:
De kleurweergave is veranderd en varieert tussen afbeeldingen, wat resulteert in opvallende verschillen in plaats van een consistent kleurenpalet in beide weergaven. Het model ziet er in beide weergaven aanzienlijk anders uit, inclusief het gezicht, het haar en de grootte.
Productgetrouwheid:
De door AI gegenereerde afbeeldingen behouden het algemene silhouet en bloemmotief van de originele jurk. Er zijn echter verschillen die de algehele getrouwheid verminderen:
Hoewel de AI-output het algemene idee van het ontwerp weergeeft, geeft deze niet volledig de authentieke look en constructie van het kledingstuk weer wat betreft lengte, mouwmaat, realisme van de stof en andere structurele details.
Naleving van de prompt:
Het algemene concept werd begrepen, maar de uitvoering wijst op beperkingen bij het bereiken van de gewenste fotorealistische kwaliteit en nauwkeurige weergave van kledingstukken die kenmerkend zijn voor productfotografie.
Kosten voor het genereren van ChatGPT afbeeldingen:

Onze keuze gaat uit naar Flux Kontext
Op basis van beeldkwaliteit, contextuele intelligentie en productiegereedheid presenteerde Flux Kontext duidelijk beter dan de andere geteste modellen. Dankzij zijn sterke punten op het gebied van realistische weergave van kledingstukken en consistente scène-generatie is het geschikt voor modecontent op grote schaal.
Daarom vormt Flux Kontext de basis voor AI-gestuurde videocreatie, waar consistentie en realisme van cruciaal belang zijn.
Nu we weten hoe AI-beeldgeneratoren presteren, gaan we kijken naar de mogelijkheden van video-AI-tools. We hebben de beste foto’s, laten we ze tot leven brengen.
Het doel van onze vergelijking is om te kijken hoe videogeneratietools omgaan met de taak om afbeeldingen om te zetten in video’s. We zullen ze beoordelen op:
Evaluatie
Consistent voldoen aan de prompt:
Seedance volgde de instructies goed op en maakte geen opvallende fouten wat betreft het afstemmen van de bewegingen en timing van het model en de bewegingen die ze uitvoert.
Getrouwheid:
De jurk lijkt te zijn bewaard gebleven zonder wijzigingen in de textuur, kleuren of vorm. Het realisme schiet echter tekort. Wanneer het model zich omdraait is er een korte versnellingsfout waarneembaar, waardoor de video geen vloeiende beweging laat zien.
Fysica:
De video laat geen natuurlijke lichaamsbeweging zien, wat van invloed is op het gedrag van de stof van de jurk. Het haar ziet er tijdens de draaiing ook nep uit.
Kosten voor Seedance 1.0 Pro-videogeneratie:
Kosten voor Full HD kwaliteit: €1,55 ($1,81) per video van 8 seconden.

Evaluatie
Consistent voldoen aan de prompt:
De bewegingen van het model zijn vrij goed en natuurlijk, wat suggereert dat de timing en bewegingen goed aansluiten bij wat er gevraagd werd.
Getrouwheid:
De tool kan de stof heel goed lezen. De kwaliteit van de jurk komt duidelijk naar voren in de opname. Dit laat zien dat de textuur en materiaaleigenschappen van het kledingstuk nauwkeurig zijn behouden tijdens het genereren.
Fysica:
Het draperen, kreuken en wapperen van de hangende sjerp is uitstekend en laat goed het natuurlijke gedrag van de stof zien. Echter is het haar niet in alle shots even realistisch, wat de natuurlijkheid van de hele video enigszins beïnvloedt.
Kosten voor Veo3-videogeneratie:
Kosten voor Full HD kwaliteit: €2,59 ($3,03) per video van 8 seconden.

Evaluatie
Authenticiteit:
Kling heeft veel potentieel. Het heeft de meest levendige en levensechte modelbewegingen, waardoor een zeer realistische weergave ontstaat. Echter is de overgang van het vooraanzicht naar het eindframe zeer onrealistisch. Dit zorgt ervoor dat de authenticiteit van de video wordt verstoord.
Consistent voldoen aan de prompt:
De modelbewegingen zijn levendig en zeer realistisch, wat wijst op een sterke afstemming op de gevraagde timing en acties.
Getrouwheid:
De jurk en het model lijken gedurende de hele video nauwkeurig te zijn weergegeven, zonder merkbare wijzigingen in het uiterlijk van het kledingstuk.
Fysica:
De fysica van de stof is zeer goed weergegeven, met een prachtig vallende jurk en natuurlijk bewegend haar. De video laat uitstekend natuurlijk gedrag zien van zowel het model als het materiaal.
Kosten voor Kling videogeneratie:
Kosten voor Full HD kwaliteit: €2,27 ($2,65) per video van 10 seconden.

Om kosten van generatieve AI te vergelijken met die van traditionele en geautomatiseerde fotostudio’s, zijn we uitgegaan van de volgende aannames:

Traditionele fotografie: topkwaliteit en unieke content
Het hangt allemaal af van hoe je studio werkt, of deze tegelijkertijd foto’s en video’s kan maken en hoe de processen zijn geoptimaliseerd. Volgens onze berekeningen bedragen de kosten per outfit naar schatting €69,25 ($81,00) voor foto’s en €122,25 ($143,00) inclusief video. Het voordeel van een traditionele fotostudio is dat de beelden echt uniek kunnen zijn, van de hoogste kwaliteit en bovendien natuurgetrouw.
Geautomatiseerde fotostudio (bijvoorbeeld Orbitvu Fashion Studio): hoog productievolume, realistische en consistente content
De Orbitvu fotostudio combineert het vastleggen van beelden en video’s, de nabewerking en publicatie in één enkel proces. Hierdoor wordt de productiecapaciteit gemaximaliseerd. Tegelijkertijd kan deze door iedereen worden bediend, niet alleen door een professionele fotograaf, dus ook door de stylist. Het zorgt voor een hoge beeldkwaliteit, consistentie en natuurgetrouwheid. We schatten de kosten voor outfits tussen €30,78 ($36,00) voor alleen foto’s en €51,29 ($60,00) voor video en foto.
Generatieve AI: snel, maar riskant
Generatieve AI-afbeeldingen vereisen invoerafbeeldingen, plat of op een paspop. We zijn uitgegaan van afbeeldingen op een paspop, omdat deze de kenmerken van kleding beter weergeven en daardoor beter zijn als invoer voor generatieve AI. Zoals verwacht, zijn de kosten voor AI-beeldgeneratie het laagst, variërend van €7,87 ($9,21) voor alleen foto’s tot €13,58 ($15,89) voor foto’s en video. Het nadeel, of beter gezegd het extra risico, is dat generatieve beelden alleen de werkelijkheid simuleren. Als de beelden te ver afwijken van het product, kunnen er extra kosten ontstaan door veel retouren en dit schaadt het merkimago.
Generatieve AI verandert de manier waarop modecontent wordt gemaakt en biedt snellere en goedkopere alternatieve voor traditionele fotoshoots. Onze tests bevestigen dat AI al visueel overtuigende foto’s en modevideo’s kan produceren met packshots en goede prompts als input.
Geen van de resultaten werd echter bij de eerste poging al behaald. Voordat we een betrouwbare opstelling hadden gevonden, hebben we meerdere iteraties doorlopen om een effectieve prompt te ontwikkelen voor het genereren van zowel afbeeldingen als video’s van een model. De prompt moest worden ontworpen om bij deze specifieke jurk en het sjaaltje te passen. Kledingstukken met zeer specifieke details moeten op maat worden aangepast, wat de schaalbaarheid beperkt en de automatisering vermindert. Het belangrijkste is dat men bij het zien van de jurk in staat is om de prompt goed te ontwerpen. Pas nadat we de prompt hadden verfijnd konden we een gestructureerde reeks tests uitvoeren in de geselecteerde AI-tools. Hoewel de workflow eenvoudig lijkt, vereist deze in de praktijk tijd, ervaring en het verbruik van het aanzienlijk aantal credits voordat de gewenste resultaten worden bereikt.
Van de geteste tools presenteerde Flux Kontext het beste wat betreft het behoud van het algehele silhouet, de kleuren en het patroon van het kledingstuk. De belangrijkste beperkingen blijven bestaan in fijne details zoals de drapering van de stof, de precieze verhoudingen en de vorm (ook van de mouwen), de kleurconsistentie en de continuïteit tussen het voor- en achteraanzicht. Het was ook het enige model dat de kleurtinten intact hield wat cruciaal is voor e-commerce.
Zodra je over goede invoerafbeeldingen beschikt, bleek het genereren van video’s veelbelovend. Door AI-gegenereerde voor- en achteraanzicht afbeeldingen van Flux Kontext als begin- en eindframes te gebruiken, konden vloeiende en realistische modevideo’s worden gemaakt die lijken op de traditionele studio-opnames. Deze korte video’s kunnen een doorbraak betekenen voor e-commerce voor mode. Het kan namelijk paservaringen bieden die klanten helpen om met meer vertrouwen een aankoopbeslissing te nemen.
{
“scene_description”: {
“setting”: “studio photo shoot with a plain white background and bright, even lighting”,
“subject”: {
“type”: “person”,
“gender”: “female”,
“age_range”: “adult”,
“pose”: “standing with one hand on hip and the other arm relaxed”,
“expression”: “smiling, facing the camera”,
“hair”: {
“color”: “dark brown”,
“length”: “medium-long”,
“style”: “loose and natural”
}
},
“outfit”: {
“type”: “long patterned dress”,
“colors”: “warm tones with floral print”,
“footwear”: {
“type”: “open-toe heeled mules”,
“color”: “black”,
“material”: “smooth leather or leather-like finish”,
“heel_height”: “medium (approximately 5–7 cm)”,
“design_details”: “minimalist slip-on style with open back and narrow band across the toes”,
“overall_style”: “elegant and modern, complementing the dress without drawing attention away from it”
}
},
“composition”: {
“framing”: “full-body shot”,
“camera_angle”: “eye-level, straight-on”,
“background”: “plain white seamless backdrop”,
“lighting”: “soft, diffused, evenly distributed”
},
“overall_style”: {
“theme”: “fashion catalog or lookbook”,
“mood”: “confident, cheerful, elegant”
},
“additional_information”: {
“note”: “The sash or fabric piece that hangs down from the dress should be wrapped around the model’s neck like a choker or scarf for the intended styling.”
}
}
}
Backview – JSON prompt
{
“scene_description”: {
“setting”: “studio photo shoot with a plain white background and bright, even lighting”,
“subject”: {
“type”: “person”,
“gender”: “female”,
“age_range”: “adult”,
“pose”: “standing with back to the camera, head slightly turned to the side”,
“expression”: “neutral, calm”,
“hair”: {
“color”: “dark brown”,
“length”: “medium-long”,
“style”: “loose and natural”
}
},
“outfit”: {
“type”: “long patterned dress”,
“colors”: “warm tones with floral print”,
“footwear”: {
“type”: “open-toe heeled mules”,
“color”: “black”,
“material”: “smooth leather or leather-like finish”,
“heel_height”: “medium (approximately 5–7 cm)”,
“design_details”: “slip-on style with open back, single wide strap across the front, and thin stiletto-style heel”,
“overall_style”: “minimalist and elegant, complementing the outfit while keeping the focus on the dress”
}
},
“composition”: {
“framing”: “full-body shot from the back”,
“camera_angle”: “eye-level, straight-on”,
“background”: “plain white seamless backdrop”,
“lighting”: “soft and evenly distributed with minimal shadows”
},
“overall_style”: {
“theme”: “fashion catalog or lookbook”,
“mood”: “elegant, composed, confident”
}
“additional_information”: {
“note”: “The sash or belt seen hanging at the back of the dress should be styled by wrapping it around the model’s neck, creating a cohesive look that matches the front view.”
}
}
}
Video prompt
“Generate a 7-second fashion showcase video using the provided packshot image as the outfit reference.
The subject is a young woman standing naturally in front of a plain, neutral studio backdrop with soft, even lighting.
The camera remains static in a medium-to-full-body shot, keeping the focus entirely on the person and the outfit.
Movements should be smooth and natural, highlighting the outfit without distractions.
Timeline of actions:
– Seconds 0–2: The subject stands in a neutral pose with minimal movement.
– Seconds 2–4: She makes a small, natural motion, such as a subtle body turn or shifting her weight slightly.
– Seconds 4–6: The model rotates smoothly around her own axis to show the **back of the outfit**, turning naturally and gracefully.
– Seconds 6–7: She finishes in a clean ending pose, holding still before the video ends.
Style:
– Fashion showcase style
– Smooth tempo, no rapid cuts or transitions
– Clean studio look with emphasis on outfit clarity
– Outfit design and details must strictly follow the provided packshot image”
Dit onderzoek is uitgevoerd door het Orbitvu-team:
Packshots: Julia Banduch
Prompts, generatieve afbeeldingen en beschrijvingen: Marek Herceliński
Copywriting: Elżbieta Binkowska
Begeleiding en ondersteuning: Tomasz Bochenek