In den vorigen Beiträgen über die verschieden Anbieter kann man sich ein Bild machen, wie (unterschiedlich) die diversen KI-Modelle einfache Prompts interpretieren.
Interessanter wird es, wenn man die Anbieter mit einem sehr detailliertem Prompt vergleicht. Das ist das Thema dieses Posts. Bei den (meisten) Bildern wurde versucht, durch Auswahl eines geeigneten Templates und ohne an vielen Stellschrauben zu drehen ein photorealistisches Bild zu erzeugen. Bis auf ganz wenige Ausnahmen wurde immer das erste erzeugte Bild verwendet, damit kann man schon mal beurteilen wie treffsicher ein Algorithmus grundsätzlich ist.
Mit jedem Anbieter kann man Bilder in vergleichbarer Qualität generieren, am aufwändigsten erscheint es mir bei Prompt Hunt. Prompt Hunt neigt leider auch dazu, Körper zu duplizieren und zu verschmelzen.
Außer den vorgestellten Anbieter gibt es aber noch viele andere, die sich im Großen und Ganzen in Qualität und Preis ziemlich ähnlich sein werden, z.B.:
- DreamStudio ist das Produkt von stability.ai, dem Unternehmen hinter dem Algorithmus Stable Diffusion. Bei Anmeldung bekommt man 25 Credits kostenlos, damit können bis zu 125 Bilder generiert werden. Weitere 1000 Credits für bis zu 5000 Bilder kann man um $ 12 kaufen. Es werden keine Abomodelle angeboten. Die Oberfläche ist nicht so umfangreich wie z.B. bei Leonardo, die wichtigsten Einstellmöglichkeiten sind vorhanden. Die Historie wird gespeichert.
- Lexica bietet eine minimalistische Oberfläche ohne Einstellungsmöglichkeiten und überrascht mit der Qualität der generierten Bilder, die aber in Lexica selbst nicht weiterbearbeitet werden können. Beim kostenlosen Konto können 16 Bilder täglich generiert werden. Abomodelle werden ab $ 10 monatlich angeboten.
- Fotor bietet neben der KI-gestützten Generierung und Weitervearbeitung von Bildern auch viele herkömmliche Tools zur Fotobearbeitung. Die Abomodelle beginnen ab € 3 monatlich und beinhalten alle angebotenen Tools. Daneben gibt es noch Einmalzahlungen und Abomodelle nur für Credits. Einigermaßen verwirrend, diese Preispolitik.
- Supermachine ähnelt von der Oberfläche her Leonardo oder Playground, beim Anmelden erhält man 10 Credits für bis zu 10 Fotos. Es gibt ein Paket mit 1000 Credits für einmalig $ 15, Abomodelle beginnen bei $ 19 monatlich für 1000 Credits.
Die Prompts auf dieser Vergleichsseite sind teilweise einfach und kurz gehalten, liefern aber genauso ansprechende Ergebnisse. Wenn man allerdings jedes Detail kontrollieren möchte, können Prompts ziemlich ausufern, also lang und kompliziert werden. Dann sollte man auch mit negativen Prompts, einem Ausschlußverfahren arbeiten.
Erschwerend kommt hinzu daß Prompts grundsätzlich in Englisch verfaßt werden, das ist wahrscheinlich eine große Hürde für viele. Die Verwendung von Alternativen oder Synonymen bringt eine zusätzliche Herausforderung ins Spiel und kann das Ergebnis nochmal ganz wesentlich beeinflußen. Teilweise werden sogenannte Prompt Generatoren angeboten, bei Eingabe einer kurzen Inhaltsangabe, auch schon bei nur einem Wort, werden Vorschläge für einen ausführerlichen Prompt gemacht.
Architektur
Prompt: a modern bungalow with a covered terrace on a slightly sloping plot, large windows, pastel-colored walls, pool with deck chairs, lots of plants and some large trees, sunny afternoon, hyper-realistic, super detailed, 8k, high quality
In der zweiten Reihe aerial view
als ergänzende Anweisung.
Sportwagen
Prompt: a modern sports car with a glossy finish
Der Prompt der 2. Reihe: a modern sports car at a car show with a female model at the side, high quality, photorealistic
mit dem negativen Prompt: no bad anatomy, no deformed feet, no extra legs, no extra arms, no double body
.
Polizeibeamter/-beamtin
Prompt: full body shot of a male Police officer with muscular body in dark blue, shiny latex uniform and crossed arms, very glossy and shiny, Reflective, Perfect composition, Hyperrealistic, super detailed, 8k, High quality, trending art, Trending on Artstation, Sharp focus, Studio photo, Intricate details, Highly detailed, Cozy wallpaper, Pastel colors, Soft Lighting
In der zweiten Reihe wurde nur das Geschlecht gewechselt.
Tiger
Prompt: a majestic tiger standing in the moonlight in the jungle on a clearing in shallow water. the tiger shows an expression of calm and confidence. the lighting casts dramatic shadows that enhance the depth and texture of the scene. high quality, lots of detail.