Gemini 2.5 Pro ist hier mit größeren Zahlen und großartigen Stimmung


Nur wenige Monate nach der Veröffentlichung der ersten Gemini 2.0 AI -ModelleGoogle wird erneut aktualisiert. Das Unternehmen sagt Das neue Gemini 2.5 Pro Experimental ist das “intelligenteste” Modell, das ein massives Kontextfenster, eine Multimodalität und Argumentationsfunktionen bietet. Google verweist auf eine Reihe von Benchmarks, die den neuen Gemini -Clobbering anderer großer Sprachmodelle (LLMs) zeigen, und unsere Tests scheinen dies zu sichern – Gemini 2.5 Pro ist eines der beeindruckendsten generativen KI -Modelle, die wir gesehen haben.

Gemini 2.5 hat wie alle in Zukunft von Google integrierten Modelle eingebaut. Die KI überprüft sich im Wesentlichen auf dem Weg zur Erzeugung einer Ausgabe. Wir nennen das gerne “simuliertes Denken”Da es keine Beweise dafür gibt, dass dieser Prozess dem menschlichen Denken ähnlich ist. Es kann jedoch einen großen Beitrag zur Verbesserung der LLM -Ausgänge leisten. Google zitiert speziell die” Agenten “-Kodierungsfunktionen des Modells als Begünstigte dieses Prozesses. Gemini 2.5 Pro Experimental Can, z.

https://www.youtube.com/watch?v=rlcbspgos6s

Gemini 2.5 Pro baut ein Spiel in einem Schritt.

Google sagt eine Menge Dinge über Gemini 2.5 Pro; Es ist schlauer, es ist kontextbewusst, es denkt– Es ist jedoch schwer zu quantifizieren, was eine Verbesserung der generativen KI -Bots darstellt. Es gibt jedoch einige eindeutige technische Voränderungen. Gemini 2.5 Pro verfügt über ein 1 -Million -Token -Kontextfenster, das für die großen Gemini -Modelle üblich ist, im Vergleich zu konkurrierenden Modellen wie OpenAI GPT oder massiv Anthropic Claude. Sie könnten mit 64.000 Token mehrere sehr lange Bücher an Gemini 2.5 Pro in einer einzigen Eingabeaufforderung füttern. Das ist das gleiche wie Flash 2.0, aber es ist immer noch objektiv viele Token im Vergleich zu anderen LLMs.

Natürlich hat Google Gemini 2.5 mit einer Batterie von Benchmarks experimentell ausgeführt, in denen es etwas höher erzielt als andere KI -Systeme. Zum Beispiel quietscht es Openais O3-Mini in GPQA und Aime 2025, wodurch die KI komplexe Fragen zu Naturwissenschaften und Mathematik beantwortet. Außerdem wurde ein neuer Rekord in der letzten Prüfungs -Benchmark der Menschheit aufgestellt, die aus 3.000 Fragen besteht, die von Domänenexperten kuratiert wurden. Die neue KI von Google verwaltete eine Punktzahl von 18,8 Prozent auf 14 Prozent von Openai.



Source link