Die KI -Kunstgeneration hat sich in wildem Tempo entwickelt und Google warf gerade einen weiteren großen Anwärter in die Mischung durch seine Gemini Flash 2.0. Sie können mit dem neuen Image -Erstellungstool in Google spielen AI Studio.
Gemini Flash ist, wie der Name schon sagt, sehr schnell, insbesondere schneller als Dall-e 3 und andere Bildschöpfer. Diese Geschwindigkeit könnte Bilder von geringerer Qualität bedeuten, aber das ist hier nicht der Fall, insbesondere weil alle Änderungen und Upgrades der Bildproduktionsfähigkeit des Modells. Wenn Sie jedoch wirklich gute Ergebnisse wünschen, müssen Sie wissen, wie man mit der KI spricht. Nach viel Versuch und Irrtum habe ich fünf Tipps zusammengestellt, um die absolut beste Kunst aus Gemini Flash 2.0 herauszuholen. Einige davon mögen den Ratschlägen zu anderen KI -Art -Schöpfer ähneln, weil sie es sind, aber das macht sie in diesem Zusammenhang nicht weniger nützlich.
Erzählen Sie eine Geschichte
Das interessanteste neue Feature für die Bilderstellung von Gemini Flash ist, dass es nicht nur für einmalige Illustrationen nicht gut ist, sondern auch dabei helfen kann, eine visuelle Geschichte zu erstellen, indem sie eine Reihe verwandter Bilder mit konsistenten Stil, Einstellungen und Stimmungen generiert.
Um loszulegen, müssen Sie sie nur bitten, um Ihnen eine Geschichte zu erzählen und wie oft Sie eine Illustration mit der Aktion verwenden möchten. Das Ergebnis enthält diese Bilder, die den Text begleiten.
Für mein Projekt bat ich die KI, “eine Geschichte eines heldenhaften Babydrachen zu generieren, der eine Feenkönigin in einem 3D -Cartoon -Animationsstil vor einem bösen Zauberer schützte. Für jede Szene erzeugen Sie ein Bild.” Ich habe gesehen, wie der oben genannte angefangen zu erscheinen. Und wenn es ein Problem gibt, können Sie eine der Teile der Geschichte umschreiben und das Modell wird das Bild entsprechend regenerieren.
Superspezifisch sein
Wenn Sie Gemini sagen, dass sie „einen Hund in einem Park“ machen sollen, können Sie einen verschwommenen goldenen Retriever bekommen, der vage grün sitzt. Aber wenn Sie sagen: „Ein flauschiger goldener Retriever, der im Herbst auf einer Holzbank im Central Park sitzt und auf dem Boden verstreut ist“, erhalten Sie genau das, was Sie sich vorstellen.
KI -Modelle gedeihen Details. Je mehr Sie anbieten, desto besser wird Ihr Bild sein. Für das obige Bild, anstatt nur nach einer futuristisch aussehenden Stadt zu fragen, forderte ich “ein Retro-futuristischer Stadtbild bei Sonnenuntergang, mit Neonschildern, die in rosa und blau leuchteten, Autos am Himmel fliegen und Menschen im Retro-Kreislaufstil-Outfits spazieren.” Sieben Sekunden später kam das Ergebnis.
Sich unterhalten
Eine meiner Lieblingsbeschäftigungen über den neuen Gemini -Flash ist, dass Sie sich damit unterhalten können, ohne einen Großteil der Geschwindigkeit zu verlieren. Das heißt, Sie müssen nicht alles auf einmal richtig machen. Nachdem Sie ein Bild generiert haben, können Sie buchstäblich mit der KI chatten, um Änderungen vorzunehmen. Möchten Sie die Farben ändern? Einen Charakter hinzufügen? Die Beleuchtung stimmungsvoll machen? Fragen Sie einfach.
In dem oben genannten Bild fragte ich zunächst nach “eine gemütliche Lesende mit einem Kamin, mit Romanen gefüllt und einem großen bequemen Sessel”. Ich habe es dann verfeinert, indem ich es gebeten habe, “es Nacht mit weicher, warmer Beleuchtung zu machen” zu machen, dann folgte und bat es, “eine schlafende Katze auf dem Sessel hinzuzufügen”, und beendete die AI “,” den Raum zu geben, ein Vintage, viktorianische Ästhetik “. Das Endergebnis auf der linken Seite sieht fast genau wie das aus, was ich mir vorgestellt habe, und fühlt sich wie ein Kunstassistent, der sich an das anpassen kann, was ich möchte, ohne jedes Mal von vorne von vorne zu beginnen.
Gemini Flash entspricht Chatgpt
Google hat sich damit gerühmt, dass Gemini voll von realem Wissen ist, was bedeutet, dass Sie historische Genauigkeit, realistische kulturelle Details und wahre Bilder erhalten können, wenn Sie danach fragen. Das erfordert natürlich, dass es spezifisch ist. Wenn Sie es zum Beispiel für “einen Wikingerkrieger” fordern, bekommen Sie möglicherweise etwas, das eher wie ein aussieht Game of Thrones Charakter. Aber wenn Sie sagen: „Ein historisch genauer Wikinger -Krieger aus dem 9. Jahrhundert mit detaillierte Kettenmail -Rüstung, einem runden Holzschild und einem traditionellen nordischen Helm“, erhalten Sie etwas viel genauereres.
Als Test bat ich die KI, “eine alte Maya -Stadt bei Sonnenaufgang mit hoch aufragenden Steinpyramiden, üppige Dschungelumgebung und Menschen in traditionellen Maya -Kleidungsstücken” zu machen. Es ist nicht perfekt, aber es sieht viel mehr wie die reale Sache aus als frühere Versionen, die manchmal mit fast einer ägyptischen Pyramide zurückkehren würden.
Schreiben Sie schnell
Die meisten KI -Bildmodelle haben lange mit dem Rendern von Text zu kämpfen und Wörter in unleserliche Kritzeleien verwandeln. Sogar die besseren Modelle heute, die dies tun können, dauern ein wenig, um es zu tun, und es kann ein paar Versuche erfordern. Aber Gemini Flash ist schockierend gut darin, Text schnell und leserlich in Bilder in Bilder zu integrieren. Sehr spezifisch zu sein kann jedoch helfen.
So habe ich das Bild oben generiert, indem ich die KI gebeten habe, “ein Reiseplakat im vintage-Stil zu erstellen, auf dem” London “in kühner, retro-Typografie besucht wird und ein stilisiertes Illustration der Stadt enthält”.