OpenaiDie Veröffentlichung von GPT-4,5 für Chatgpt Plus Abonnenten in dieser Woche haben mich sofort daran interessiert, es auszuprobieren, allerdings mit einiger Skepsis. Es gab Berichte über OpenAI (und andere Entwickler), die darum kämpften, die großen Verbesserungen ihrer Modelle zu verbessern, die wir zuvor gesehen haben. Und das aktuelle Standardmodell GPT-4O ist in den meisten Fällen ziemlich gut. Und wenn Sie einen umfassenden Bericht wünschen, Es gibt das tiefe Forschungsmerkmal.
OpenAI behauptet, dass GPT-4,5 eine hohe emotionale Intelligenz und ein differenziertes Verständnis dafür hat, was Sie dazu sagen. Die Beschreibung des Unternehmens hat ein Bild beider Modelle als zuverlässige Freunde gemalt, aber dass GPT-4,5 das sein würde, von dem Sie an Ihrem Geburtstag ein Gedichtbuch erwarten würden. Daher habe ich mich entschlossen, 4.5 gegen 4O mit ein paar Eingabeaufforderungen zu testen, die jeder lässige Chatgpt -Benutzer bereitstellen könnte.
AI -Poesie
Mit dieser Analogie in meinem Kopf beschloss ich, mit einer poetischen Herausforderung zu beginnen. Ich habe beide Modelle gefragt, “Kannst du mir ein kurzes Gedicht über einen regnerischen Nachmittag in New York City schreiben und ein Bild dafür machen?” Es schien fair zu sein, dass der Dichter in den meisten Menschen aus einem Regenfenster in einer geschäftigen Stadt ausgeschaut hat.
GPT-4,5 befindet sich links und GPT-4O ist rechts. Sie sind erstaunlich ähnlich. Ich persönlich denke, GPT-4,5 hat mit ähnlichen Ideen einen etwas besseren Job gemacht. Es ist nicht nur an das Aussehen des Regens, sondern auch an das Gefühl des grauen Himmels, Pfützen und Verkehrs zwischen den Regentropfen. In einem blinden Test von drei zufälligen Freunden wählten zwei von drei gleich, wobei das dritte sagte, sie zogen nur das Reimschema von GPT-4O vor.
Bei den Bildern verwendeten beide Modelle Dall-E 3, aber GPT-4,5 sieht viel realistischer aus. Ich bevorzuge tatsächlich die impressionistische Beleuchtung von GPT-4Os Versuch, aber beide machen die Idee des Gedichts ziemlich gut.
Oscar Insight
Mit den jüngsten Oscars ging ich mit einer lustigen Trivia-Frage mit einer komplexeren, subjektiven Follow-up: “Wer hat 2023 die beste Schauspielerin Oscar gewonnen, und was hat ihre Leistung hervorgehoben?”
Beide hatten die richtige Antwort auf Michelle Yeoh für “alles überall auf einmal”, aber GPT-4,5 hatte eine wirklich nette Erklärung, warum ihre Leistung bei den Zuschauern schwang. Es berichtete über ihre Leistung und erwähnte, wie Yeoh der erste Asiaten war, der diesen Oscar gewann. Die Antwort von GPT-4o hatte viele der gleichen Beats, aber es ging zu einem seltsamen Aufsatz und einem nummerierten Listenformat, das zu lesen war, als die Frage eine einfache Meinungsanfrage war. Die Antwort von GPT-4.5 fühlte sich eher so an, als würde ein echter Mensch antworten, wenn auch einer, der sich sehr für diesen Film und Yeoh als Performer interessiert.
Einfacher Koch
Schließlich habe ich die Modelle gegen den ewigen täglichen Kampf mit dieser Aufforderung gestellt: “Ich bin langweilig von Pasta. Können Sie ein einfaches Abendessen mit einem einfachen Abendessen vorschlagen, das anders, aber nicht kompliziert ist?”
Ich weiß nicht, welche Art von kulinarischer Inspiration ich erwartet hatte, aber GPT-4,5 traf mit geröstetem Brokkoli den Nagel auf den Kopf mit Honig-Knoblauchlachs. Sie können sehen, dass es ein sehr einfaches, kurzes Rezept ist und einfach und schnell zu machen scheint. GPT-4O ging mit Knoblauchgarnelen und geröstetem Gemüse. Das ist keine schlechte Idee für eine Mahlzeit (obwohl ich persönlich das Protein ändern müsste), aber Sie können sehen, dass die Zubereitung allein mehrere Pfannen zur Vorbereitung benötigt und die Zutatenliste nicht einmal in den gleichen Raum wie das gesamte Rezept von GPT-4,5 passt. Ich fragte nach einfachem und nicht kompliziertem, gpt-4,5 lieferte so weitaus besser, würde ich sagen.
Tiefe Gedanken
GPT 4.5 gibt die Atmosphäre, die nicht stationären Präferenzen in einer Eingabeaufforderung im Vergleich zu GPT-4O zu erkennen. Aber es ist sehr subtil, diese emotionalen Untertöne aufzunehmen. Ohne direkten Vergleich wissen Sie vielleicht nie, dass es einen Unterschied gibt.
GPT-4O ist in seinen Antworten effizient, genau und praktisch, und seine Gedichte sind völlig ausreichend. Ich würde nicht sagen, dass die auf der kostenlosen Stufe, die sie benutzt, zumindest im Moment keinen Zugriff auf GPT-4,5 haben. Im Laufe der Zeit kann sich dies ändern, da GPT-4,5 immer noch eine Forschungsvorschau ist und nicht vollständig und nicht vollständig und außen ist. Ich werde weiterhin mit beiden experimentieren und sehen, ob es Arten von Eingabeaufforderungen gibt, bei denen das neue Modell definitiv besser ist, aber im Moment würde ich sagen, dass Sie sich keine Sorgen darüber machen, welches Modell Sie einsetzen, es sei denn, Sie planen eine Mahlzeit und haben nicht viel Zeit, sich vorzubereiten.