Testing Generative AI for Product-Fotografie: Authentic Lifestyle Perfume Shots

State of generative AI technology for Produktfotografie_ creating lifestyle perfume shots with AI max2.png

Inhaltsverzeichnis

Bevor Sie beginnen
Kann generative KI ein Gamechanger für Lifestyle-Produktfotografie sein?
Zeit für einen Test: 4 verschiedene Parfümflakons, 4 Herausforderungen für KI
Vergleich von D&G
Vergleich von Spice Bomb
Vergleich von Just Cavalli
Vergleich von Qaed Al Fursan
Zusammenfassung der Tests
Welches KI-Tool ist das beste?

Bevor Sie beginnen

Dieser Artikel wirft einen genauen Blick darauf, wie generative KI zur Erstellung von Lifestyle-Parfümflakon-Aufnahmen eingesetzt wird und was das für die Zukunft der Produktfotografie bedeutet. Wir vergleichen 5 verschiedene KI-Hintergrundgenerator-Tools/Modelle mit einem einzigen Prompt, ohne zusätzliche Bearbeitungen. So, als würden die Fotos von durchschnittlichen Nutzern generiert, die keine Experten sind und erwarten, akzeptable Ergebnisse zu erzielen, wie es die Tools versprechen. Dieser Ansatz ermöglicht es uns zu testen, wie die KI-Technologie in einem realistischen Szenario abschneidet.

Kann generative KI ein Gamechanger für Lifestyle-Produktfotografie sein?

Im heutigen Geschäftsleben geht es vor allem darum, schnelle, kosteneffiziente und effektive Wege der Content-Produktion zu finden. Bis vor Kurzem erforderte Lifestyle-Fotografie sorgfältige Planung, Budgetierung, die Suche nach einem geeigneten Studio, professionelle Fotoausrüstung und einen erfahrenen Fotografen. Jetzt verspricht generative KI einen potenziell einfacheren und effizienteren Weg: Alles, was Sie brauchen, ist ein Packshot, ein generatives Bild-zu-Bild-KI-Tool und ein guter Prompt. Das versprochene Ergebnis ist ein perfektes Lifestyle-Bild mit einem beeindruckenden KI-generierten Hintergrund – in kürzester Zeit und zu einem Bruchteil der Kosten. Aber ist das wirklich so?

Zeit für einen Test: 4 verschiedene Parfümflakons, 4 Herausforderungen für KI

Um gründlich zu testen, wie generative KI-Modelle mit virtuellen Fotoshootings umgehen können, haben wir Parfüms als repräsentatives Beispiel gewählt. Parfümflakons, die transparent und reflektierend mit markanter Markengestaltung sind, stellen KI-Algorithmen vor Herausforderungen bei der korrekten Beleuchtung, der Einbindung in die Umgebung, der Beibehaltung authentischen Brandings und der Beschriftungen.

Wir haben vier verschiedene Düfte ausgewählt, die jeweils einen unterschiedlichen Stil und eine andere Herausforderung für die Algorithmen darstellen – von metallischen Reflexionen über Transparenz bis hin zu aufwendiger Ornamentik und nicht standardmäßigen Formen.

Obwohl Parfüms als primäres Beispiel dienen, lassen sich die Ergebnisse dieser Untersuchung allgemein auf andere Produkttypen übertragen.

Zeit für einen Test: Parfüms

Just Cavalli (Roberto Cavalli) — ein eleganter Flakon mit metallischem Finish und einem markanten Logo, das seine Umgebung im Licht reflektiert.
Warum wir diesen gewählt haben: Gut geeignet, um zu testen, wie verschiedene Modelle reflektierende Produkte mit der Umgebung verschmelzen. Zusätzlich zeichnet sich der Flakon durch ein futuristisches Design aus, was ihn ideal für eine CGI-Szene mit Sci-Fi-Ästhetik macht. Wir wollten sofort etwas erstellen, das einem 3D-Rendering ähnelt.

just-cavali-Packshot-alphashot-pro-g2-orbitvu-perfume-bottle-AI-generated-background-article

Qaed Al Fursan (Lattafa) — ein quadratischer Flakon im orientalischen Stil mit aufwendiger Gold- und Schwarzgrafik und arabischen Inschriften.
Warum wir diesen gewählt haben: Wir wollten testen, wie gut nicht-lateinische Texte und Muster vom KI-Tool reproduziert werden.

qaed-al-fursan-lattafa-Packshot-alphashot-pro-g2-orbitvu-perfume-bottle-AI-generated-background-article

Spicebomb Extreme (Viktor&Rolf) – ein designerischer granatenförmiger Flakon mit mattem schwarzem Finish und einem kupferfarbenen Metallband.
Warum wir diesen gewählt haben: Ein generisches, einfaches Produkt, das für ein generatives KI-Tool keine Probleme bereiten sollte.

spicebomb-Viktor&Rolf-Packshot-alphashot-pro-g2-orbitvu-perfume-bottle-AI-generated-background-article

Devotion (Dolce & Gabbana) – ein klassischer transparenter Flakon mit einer dekorativen goldenen herzförmigen Plakette im Vintage-Stil.
Warum wir diesen gewählt haben: Ausgewählt wegen seiner Transparenz sowie der komplexen und markanten Ornamentik mit Branding.

Devotion-Dolce&Gabbana-Packshot-alphashot-pro-g2-orbitvu-perfume-bottle-AI-generated-background-article

Zeit für einen Test: KI-Tools

Generative Bild-zu-Bild-KI-Technologien erstellen ein neues Bild auf Basis des Eingabebildes und des Prompts. Konstruktionsbedingt „möchte“ ein GenAI-Modell das Eingabebild und insbesondere das darin enthaltene Produkt verändern. Ältere Technologien hatten Schwierigkeiten, die Produkttreue in der neu generierten Szene aufrechtzuerhalten, und das Originalprodukt wurde meist verzerrt. Wenn die Treue erhalten blieb, wirkte das Produkt oft künstlich in die Umgebung eingefügt. Die fortschrittlichsten Tools können dieses Gleichgewicht herstellen, indem sie die Produktauthentizität im neuen Bild bewahren und es gleichzeitig durch realistische Reflexionen, Schatten, angepasste Beleuchtung und Transparenz nahtlos in die neue Umgebung integrieren.

Es gibt Hunderte von virtuellen Fotoshooting-Tools. Die meisten basieren auf denselben Grundtechnologien bzw. KI-Modellen. Wir haben uns für die populärsten KI-Modelle und -Tools entschieden, die hochwertige Ergebnisse versprechen.

Midjourney – ein fortschrittlicher KI-Bildgenerator, bekannt für die Erstellung extrem realistischer, stilisierter und künstlerisch beeindruckender Hintergründe. Sein größter Vorteil ist ein ausgeprägter visueller Stil, der Kreative, Grafikdesigner und Marketer anzieht.
ChatGPT Modell 5 – ein Bildgenerator, der in ChatGPT integriert ist und auf dem gpt-image-1-Modell basiert. Er erstellt Bilder auf Basis von Textbeschreibungen oder mit Bildeingabe. Er ist einfach zu bedienen, und die Bildtreue der Ausgabe kann bis zu einem gewissen Grad gesteuert werden.
Flux.1 Kontext Pro – ein Modell zur Szenengenerierung und Bildbearbeitung, das hohe Eingabebild-Treue verspricht. Speziell darauf ausgelegt, hohe Produkttreue (in diesem Kontext) beizubehalten. Es gibt zwei Optionen: Flux.1 Kontext Pro oder Flux.1 Kontext Max. Wir haben uns für die „Pro“-Variante entschieden, die günstiger und angeblich weniger genau ist, aber für unseren Test bessere Ergebnisse lieferte.
Flair AI – ein Bildhintergrund-Generator und Fotoeditor für Produktfotos. Verspricht „fotorealistische Produktbilder, die von professioneller Fotografie nicht zu unterscheiden sind. Rendert Texturen, Reflexionen und Beleuchtung originalgetreu, um beeindruckende Produktvisualisierungen zu erstellen.“
Nano Banana (Gemini 2.5 Flash Image) – ein intelligentes Bildgenerator- und Editor-Modell von Google, konzipiert für konversationelle Nutzung. Seine Hauptstärken sind die Konsistenz von Charakteren über mehrere Bearbeitungen hinweg, nahtlose Bildverschmelzung und extrem schnelle Leistung („Instant Photoshop“). Alle Ausgaben sind mit Wasserzeichen versehen und mit SynthID für Rückverfolgbarkeit und Sicherheit eingebettet. Perfekt für Kreative, die natürliche, intuitive Bildbearbeitung in einem einzigen Tool wollen.

Zeit für einen Test: Eingabe-Packshots

Alle Packshots wurden in hoher Auflösung im PNG-Format mit transparentem Hintergrund aufgenommen, wobei die Halbtransparenz der Flaschen erhalten blieb. Wir verwendeten unser automatisiertes Fotostudio ALPHASHOT PRO G2 mit Orbitvu Station Software.

Hochwertige Eingabebilder sind entscheidend für die Präzision bei der Generierung von KI-Hintergründen. Diese Qualität ermöglicht eine genaue Bewertung, wie die Algorithmen mit Details, Kanten und der Integration in die generierte Szene umgehen.

Alphashot-pro-g2-automated-photo-studio-E-Commerce-photography

just-cavali-Packshot-alphashot-pro-g2-orbitvu-perfume-bottle-AI-generated-background-article-side-by-side

qaed-al-fursan-lattafa-Packshot-alphashot-pro-g2-orbitvu-perfume-bottle-AI-generated-background-article-side-by-side

spicebomb-Viktor&Rolf-Packshot-alphashot-pro-g2-orbitvu-perfume-bottle-AI-generated-background-article-side-by-side

Devotion-Dolce&Gabbana-Packshot-alphashot-pro-g2-orbitvu-perfume-bottle-AI-generated-background-article-side-by-side

Vergleich von D&G

Wir haben also 4 Produkte und 5 populäre KI-Hintergrundgeneratoren. Für jedes Parfüm haben wir einen separaten Prompt vorbereitet, der eine Lifestyle-Szene beschreibt, 2–4 Fotos generiert und das beste ausgewählt. Um die Qualität der KI-Modelle zu messen, haben wir wichtige Merkmale der Lifestyle-Fotografie berücksichtigt und Punkte für jedes vergeben:

Produkttreue (max. 10 Pkt.): Das ideal generierte Bild sollte die Form, Farben und markanten Merkmale des Produkts präzise beibehalten, wie Transparenz und Reflexion. Die Beibehaltung von Produkt-Branding, Beschriftungen und Ornamenten ist entscheidend. 10 Punkte bedeuten, dass keine zusätzliche Nachbearbeitung erforderlich wäre, um ein mit traditionellen Methoden vergleichbares Ergebnis zu erzielen – was in der Lifestyle-Produktfotografie entscheidend ist.
Umgebungsintegration (max. 8 Pkt.): Das Produkt sollte sich natürlich in die generierte Umgebung/den Hintergrund einfügen. Reflexionen, Farben, Beleuchtung und Schatten sollten alle zur generierten Umgebung passen. Dies ist wichtig für die wahrgenommene Qualität der Lifestyle-Fotografie, aber nicht so wichtig wie die Produkttreue. 8 Punkte bedeuten Ergebnisse, die mit einem traditionellen Fotoshooting vergleichbar sind.
Szenenästhetik (max. 7 Pkt.): Dies umfasst Komposition, Kreativität der Szenerie und natürliches Erscheinungsbild der Szene. Dies ist unser subjektives Maß.
Prompt-Befolgung (max. 5 Pkt.): Die Szene sollte wie beschrieben generiert werden, und die Position des Produkts sollte beibehalten werden. Obwohl wichtig für den Workflow eines Stylisten, ist dies weniger kritisch als die Produkttreue. Max. 5 Punkte für 100%ige Prompt-Befolgung.

Vergleich von D&G

Der Prompt:

“A luxurious Mediterranean terrace overlooking the sea, with a panoramic view of a sunlit coastline and deep blue water. Elegant stone surface in the foreground, surrounded by blooming citrus flowers, green glossy leaves with morning dew, and subtle elements like vanilla pods and candied fruit pieces. Bright, clear sky, a few yachts sailing in the distance. Sophisticated, warm summer atmosphere — perfect backdrop for a high-end fragrance product. Keep the original angle, position, and perspective of the perfume bottle from the uploaded image exactly as it is. Create in resolution 16:9, maintain original identity, and input fidelity to high.”

Midjourney

AI background generator: Midjourney

Unsere Einschätzung: Bottle shape and proportions, logotype, and ornament are only slightly distorted. Overall, product Funktionen are well-preserved. The product doesn’t blend in perfectly with the background: the reflections in the cup are studio-like (like reflections from the environment), the transparency is somehow handled, but in reality, the bottle is less transparent (real transparency was provided in the input image). Also, the shadow is a little too big for a small transparent bottle. The position of the bottle is maintained as requested in the prompt. The scenery, allerdings, is clearly artificial, and the prompt regarding the perfume ingredients hasn’t been fully followed. Gesamtbewertung: 63%

Research results for Midjourney with Dolce & Gabbana perfume based on Product fidelity of max 10 points, Environment blending of max 8 points, Scene aesthetics of max 7 points, Prompt adherence of max 5 points & Total of max 30 points

Flux.1 Kontext PRO

AI background generator: Flux.1 Kontext PRO

Unsere Einschätzung: The product's proportions in the image differ from the real product, appearing wider and bulkier. While the fluid color is slightly altered, this may be an adaptation to the scene lighting. The product nicely blends into the new scene, featuring a pleasing reflection from the light in the bottom left corner. Transparency is well highlighted and aligns with the actual product. Although the reflection in the cup is modified and doesn't match the environment, it still surpasses other models. The shot's perspective was modified from the straight-on Packshot. We tried several other attempts modifying the prompt, but somehow the model “insists” on the angled diagonal shot of the fragrance. Overall, the scene looks natural and pleasing. Gesamtbewertung: 70%

Research results for Flux.1 Kontext PRO with Dolce & Gabbana perfume based on Product fidelity of max 10 points, Environment blending of max 8 points, Scene aesthetics of max 7 points, Prompt adherence of max 5 points & Total of max 30 points

Chat GPT model

AI background generator: Chat GPT model 5

Unsere Einschätzung: The fragrance proportions and shape in the image differ significantly from the real product: the cup is longer and thinner, and the bottle is bulkier. The branding and ornament are well-maintained. Fluid color is altered too much, even considering the scene lighting. The product blends well into the new scene, with natural shadow and semi-transparency in the bottle. The reflection in the cup is modified and doesn't match the environment, nor the lighting, which is coming from left, not right. Position is not maintained. Again, this model also tries to “improve” it. Apart from that, the AI model followed all the prompt instructions. When it comes to aesthetics, the scene looks quite artificial, especially the flowers and oversaturated colors. Gesamtbewertung: 57%

Research results for Chat GPT model 5 with Dolce & Gabbana perfume based on Product fidelity of max 10 points, Environment blending of max 8 points, Scene aesthetics of max 7 points, Prompt adherence of max 5 points & Total of max 30 points

Flair AI

AI background generator: Flair AI

Unsere Einschätzung: The bottle cup proportions and shape differ significantly from the real product: the cup is longer and thinner in the original image. The branding and ornament are distorted: the ornament and logotype are “reinvented” by the model. Fluid color is altered too much: oversaturated. The product blends well into the new scene, with natural shadow and semi-transparency in the bottle, which distorts elements behind the bottle. The reflection in the cup is modified; it doesn't match the environment and the lighting, which is coming from the left, not from both sides. Position isn’t maintained. This model also changes the product position, although instructed to maintain the one from the input image. The AI model followed all the prompt instructions. As for aesthetics, the scene looks quite artificial, especially the flowers and oversaturated colors, similar to ChatGPT. Gesamtbewertung: 50%

Research results for Flair AI with Dolce & Gabbana perfume based on Product fidelity of max 10 points, Environment blending of max 8 points, Scene aesthetics of max 7 points, Prompt adherence of max 5 points & Total of max 30 points

Nano Banana

AI background generator: Nano Banana

Our take: The generated image of the D&G fragrance bottle is a strong and faithful reproduction of the original. The proportions of the cap and bottle are preserved accurately, and the ornate heart-shaped emblem with the DG monogram is well-rendered, maintaining the brand’s recognizable detailing. The liquid color, while slightly richer, is natural and fits the warm tone of the overall composition rather than feeling oversaturated. As for the blending with the background, the bottle integrates naturally into the bright coastal background, with realistic shadowing and convincing semi-transparency in the glass that distorts the view behind it. The lighting direction is coherent, and reflections on the cap, though stylized, don’t break the visual harmony. The added flowers, sugared fruit, and vanilla sticks enrich the storytelling but look somewhat artificial. Overall, this result balances product fidelity with an aesthetically pleasing scene. Gesamtbewertung: 87%

Research results for Nano Banana with Dolce & Gabbana perfume based on Product fidelity of max 10 points, Environment blending of max 8 points, Scene aesthetics of max 7 points, Prompt adherence of max 5 points & Total of max 30 points

Comparative Table for Dolce & Gabbana perfume bottle with percentage score of Midjourney, Flux.1 Kontext Pro, ChatGPT model 5, FlairAI, Nano Banana

Vergleich von Spice Bomb

The prompt:
“A high-end dramatic studio background with large autumn leaves bursting from the center, water splashes surrounding the base, cinematic lighting with a gradient grey-to-white backdrop, hyperrealistic detail, luxury advertising style. Do not modify the original perfume bottle; leave it exactly as it is. Create in resolution 16:9, maintain original identity and input fidelity to high.”