Openai hat hinzugefügt Bildendegeneration und Bearbeitungsfunktionen Zu Chatgpt 4o, und obwohl es ernsthaft gute Bilder produzieren und beeindruckende Änderungen an sie vornehmen kann, wurden mich die seltsamen Regeln für die Textrendierung völlig frustrierend.
Beginnen wir zunächst mit den Positiven.
Vorher Chatgpt stützte sich auf Dall-e für seine Bildgenerierung, und jetzt kann es den Job selbst erledigen. Die Bilder, die es produziert, erscheinen langsam, aber außergewöhnlich gut. Schauen Sie sich diesen Robin zum Beispiel im Winter an.
Ein Robin im Winter, der von Chatgpt erstellt wurde. (Bildnachweis: OpenAI)
Es hat auch kein Problem damit, Menschen zu schaffen. Hier ist eine glückliche Familie, die am Strand spielt:
Eine glückliche Familie am Strand, der mit Chatgpt erstellt wurde. (Bildnachweis: OpenAI)
(OK, wenn Sie die rechte Hand der Mutter sehr genau schauen, können Sie sehen, dass die Finger immer noch ein bisschen wackelig sind).
Beeindruckende Änderungen
Chatgpt kann auch Bilder für Sie bearbeiten. Ich war sehr erfreut zu sehen, dass, wenn Sie ein Foto mit einem Wasserzeichen hochladen und ihn bitten, den Text über das Bild zu entfernen Geminis neue Fähigkeiten zur Bearbeitung eines nativen Bildbearbeitung . Dies ist genau so, wie es sein sollte und gut gemacht werden sollte, um das Urheberrecht zu respektieren.
Chatgpt kann jedoch Bilder bearbeiten, die nicht urheberrechtlich geschützt sind. Ich habe ein paar hochgeladen, um es zu testen, und es war wirklich beeindruckend darin, Hintergründe zu ändern, Menschen in einem Bild zu ändern, während der Rest des Bildes gleich bleibt oder die Stimmung eines Bildes änderte.
Hier ist wieder die Familie, wobei der Hintergrund in einen städtischen Park geändert wird:
Chatgpt, ändern Sie den Hintergrund in “Urban Park”. (Bildnachweis: OpenAI)
OpenAI sagt, dass seine Fähigkeiten zur Bildungsgenerierung gut für „Bilder, die stark textgeschrieben sind: z.
Der Text war lange Zeit, mit dem AI immer zu kämpfen hatte. Wenn Chatgpt diese Hürde erobern kann, wäre es wirklich etwas.
Also bat ich es, ein paar Gedichte auf einem Grabstein in einem Friedhof in England zu rendern, um es zu testen. Dann stieß ich auf ein Problem.
Möchten Sie ein Bild von Wörtern auf einer Steintafel auf einem Friedhof zeichnen? Chatgpt sagt nein, es kann keine Worte auf einen Grabstein zeichnen. OK, wie wäre es mit einer Steintafel auf dem Land? Chatgpt sagt nein, nicht auf einer Steintafel. OK, können Sie ein paar Wörter auf einen Wegweiser zeichnen? Chatgpt sagt, nein. All diese Dinge verstoßen gegen die „Inhaltsrichtlinien“. Ok, wie wäre es mit einer Tasse Kaffee? Kann ich Sie zumindest dazu bringen, ein paar Gedichtlinien auf eine Kaffeetasse zu legen?
Chatgpt sagt:
“Ich kann kein Bild dieses Textes auf einer Kaffeetasse generieren, da es sich um einen realistischen, lesbaren Text auf einem physischen Objekt handelt, das unter Inhaltsrichtlinien nicht zulässig ist.”
Ich meine, warum?
Welche mögliche Kriminalität begehen das?
Verärgert bat ich Chatgpt, die Worte meines Gedichts künstlerisch, aber nicht auf ein Objekt zu zeichnen. Chatgpt antwortete:
“Ich kann ein Bild mit diesem spezifischen Text, der auf realistische oder lesbare Weise gerendert wird, aufgrund von Inhaltsrichtlinienbeschränkungen bei der Generierung langwieriger, realistisch aussehender Text in Bildern nicht generieren.”
“Langwierig” scheint hier das Problem zu sein, obwohl ein paar Gedichtlinien kaum “langwierig” sind. Dies scheint auch ironisch zu sein, da OpenAI die neuen Bildfunktionen von ChatGPT angekündigt hat, indem er ein Bild einer Tafel mit geschriebenen Wörtern veröffentlichen, ein Bild, das vermutlich von ChatGPT erstellt wurde. Vielleicht würden Blackboards funktionieren?
Text auf einer Blackboard, die mit Chatgpt erstellt wurde. (Bildnachweis: OpenAI)
Wenn ich es bitte, eine kleine Anzahl von Wörtern zu zeichnen, z. B. „Störs Sinn machen“, wird es beispielsweise auf einer Tafel erledigt (siehe oben), aber als ich es bat, ein paar Gedichtlinien auf der Blackboard zu zeichnen, lehnt es immer noch ab.
Wenn ich Dall-e bat, die gleichen Gedichte zu produzieren, die auf einem Grabstein in einem englischen Friedhof geschrieben wurden, hatte es kein Problem, ein Problem zu erfüllen. Leider waren die Worte nicht wirklich lesbar.
Es scheint nur unglücklich, dass wir jetzt einen KI -Bildgenerator haben, der lesbare Wörter erzeugen kann, und er ist eingeschränkt.
Der Text, den er produziert, ist viel besser als so etwas wie Dall-E, es ist nur frustrierend, dass Sie die Funktion für nichts Nützliches nicht nutzen können.
Sie können auch mögen