Google hat sein neues KI Modell „Imagen 4“ zur Bildgenerierung zur Nutzung für zahlende Kunden freigegeben. Imagen 4 steht aktuell als Preview Version zur Verfügung. Was taugt Imagen 4 und welche Resultate sind zu erwarten? Wir machen den Check:
Imagen 4 Versionen
Google bietet sein KI Modell Imagen 4 derzeit in der Standard und der Ultra Version als Vorschau an. Die Ultra Version soll noch detailliertere Bilder erstellen können und richtet sich primär an professionelle User. So sind auch die Preise für die Nutzung von Imagen 4 Ultra deutlich teurer. So soll die Bildgenerierung mittels Imagen Standard 0.04 US Dollar kosten. In der Ultra Edition 0.06. US Dollar. Zum Vergleich: Bilder welche mit dem Vorgängermodell Imagen 3 erstellt wurden, kosten 0.03 US Dollar in der Generierung.
Text zu Image Generierung
Zeit also um einige Text Bilder mit der Preview Version von Imagen 4 zu generieren. Die Vorschauversion des neuen KI Modells seht allen zahlenden Kunden in Google Gemini zur Verfügung. Wir starten mit folgendem Prompt und erstellen ein erstes Imagen 4 generiertes Bild: „Erstelle ein Foto, am Brandenburger Tor, ein Elefant ist auf dem Platz, am Himmel sieht man eine startende, grosse Rakete. Es ist Winter und überall liegt Schnee.“
Ergebnis:

Was auffällt, die Bild Generierung ist extrem schnell. Nach absetzen des Prompts ist das Bild innert wenigen Sekunden generiert. Das KI Modell Imagen 4 scheint den Prompt gut verstanden zu haben. Alle geforderten Elemente sind abgebildet.
Wir möchten das Bild nun leicht modifizieren und lassen Gemini wissen, dass wir den Elefanten etwas kleiner haben möchten. Diese Funktion ist jedoch noch nicht in der Preview Version vorhanden:

Wir generieren ein weiteres Bild mit folgendem Prompt: „Erstelle ein Bild, auf der Zugspitze, zwei Bergsteiger, sie winken in die Kamera, perfektes Wetter, sie haben ein rotes Seil dabei“. Ergebnis:

Die KI setzt den Prompt nahezu perfekt um. Der Prompt wurde korrekt verstanden. Das Bild sieht sehr realistisch aus. Auch Details wie die Schatten scheinen zu passen.
Bilder mit Text
Aktuelle und bereits ältere KI Bildgenerierungsmodelle haben häufig Probleme Textelemente in den generierten Grafiken korrekt darzustellen. Machen wir somit einige Tests mit Googles Imagen 4 KI bei der Erstellung mit Texinhalten. Wir verwenden folgenden Prompt: „Erstelle ein Bild, eine aus Holz geschnitzte Figur, ein Zwerg auf einem Pferd, in der Hand eine Fackel, auf dem Sockel die Inschrift: „Zum 78. Geburtstag, lieber Paul“.
Ergebnis:

Auch hier setzte Imagen 4 der geforderte Prompt gut um. Der Schriftzug ist korrekt erkennbar. Dieser ist jedoch nicht ganz mittig, wie man es grundsätzlich erwarten könnte. Machen wir ein weiteres Beispiel: „Erstelle ein Bild: Eine Geburtstagskarte für Paul, er mag schnelle Autos und Bier, seine Lieblingsfarbe ist blau. Er wird 78 Jahre alt.“
Ergebnis:

Das mittels Imagen 4 generierte Bild ist gemäss Prompt generiert und alle Elemente sind vorhanden. Die Karte wurde jedoch von der KI in englischer Sprache verfasst. Auf die Aufforderung via Prompt die Karte doch in deutsch zu generieren wird wieder der Hinweis ausgegeben, dass die Bearbeitung von bestehenden Grafikdateien noch nicht verfügbar sei.
Fazit
Die Resultate vom Google neuem KI Bildgenerierungsmodell „Imagen 4“ sind sehr gut. Mit Imagen 4 lassen sich sehr schnell Bilder generieren die sehr passend zu den Prompteingaben sind. Bei allen unseren Versuchen sind die umgesetzten Bilder zudem realistisch. Imagen 4 reiht sich in die KI-Modelle ein mit welcher fotorealistische Bilder erstellt werden können die von blossem Auge nicht mehr als KI generiert erkennbar sind. Wie bei allen generierten Bild- oder Videoelementen in Google Tools wird auch hier mittels SynthID Technologie ein Wasserzeichen integriert. Ein Wasserzeichen ist sichtbar und ein weiteres für den Menschen unsichtbar direkt in der Bilddatei integriert.
Das Imagen 4 KI Modell scheint bereits relativ ausgereift zu sein. Probleme bietet noch die korrekte Sprachwahl bei der Textgenerierung in Bildern. Zudem lassen sich bereits generierte Inhalte aktuell noch nicht nachberarbeiten.
Google's Imagen 4 Bildgenerator im Test
4.5 / 5
Pros
- Sehr schnelle Bildgenerierung
- Sehr realistisches Prompt Verständnis
- Fotorealistische Bilder möglich
Cons
- Nur für zahlende Kunden verfügbar
- Sprachwahlprobleme bei Text Generierung