Google enthüllt eine Familie der KI-Argumentationsmodelle der nächsten Generation


Am Dienstag stellte Google Gemini 2.5 vor, eine neue Familie von KI -Argumentationsmodellen, die vor der Beantwortung einer Frage „denken“.

Um die neue Modelsfamilie zu beginnen, startet Google Gemini 2.5 Pro Experimental, ein multimodales KI -Modell, das das Unternehmen behauptet, das intelligenteste Modell zu sein, das es bisher bisher ist. Dieses Modell wird am Dienstag auf der Entwicklerplattform des Unternehmens Google AI Studio sowie in der Gemini-App für Abonnenten des AI-Plans von 20 US-Dollar pro Monat erhältlich sein.

Laut Google werden alle neuen KI -Modelle Argumentationsfunktionen aufweisen.

Seit Openai das gestartet hat Erstes KI -Argumentationsmodell im September 2024O1, die Tech -Industrie hat die Fähigkeiten dieses Modells mit ihren eigenen entspricht oder übertroffen. Heute verfügen Anthropic, Deepseek, Google und XAI über AI-Argumentationsmodelle, die durch Probleme mit zusätzlicher Rechenleistung und Zeit für Fakten und Vernunft vorhanden sind, bevor sie eine Antwort abgeben.

Argumentationstechniken haben AI -Modellen geholfen, neue Höhen bei Mathematik- und Codierungsaufgaben zu erreichen. Viele in der Tech -Welt glauben, dass Argumentationsmodelle ein wesentlicher Bestandteil von AI -Agenten sein werden, autonome Systeme, die Aufgaben weitgehend ohne menschliche Intervention ausführen können. Diese Modelle sind jedoch auch teurer.

Google hat zuvor mit KI -Argumentationsmodellen experimentiert und zuvor im Dezember eine „denkende“ Version von Gemini veröffentlicht. Aber Gemini 2.5 stellt den bisher schwerwiegendsten Versuch des Unternehmens dar, die “O” -Modelleserie von Openai zu besiegen.

Google behauptet, dass Gemini 2.5 Pro seine früheren Frontier -KI -Modelle und einige der führenden konkurrierenden KI -Modelle auf mehreren Benchmarks übertrifft. Insbesondere hat Google Gemini 2.5 so gestaltet, dass es sich um eine Excel -Erstellung von visuell überzeugenden Web -Apps und Agentencodierungsanwendungen erstellt.

Bei einer Bewertung der Bewertung der Code, die als Aider Polyglot bezeichnet wird, bewertet Google, dass Gemini 2.5 Pro 68,6%erzielt, und die Top -KI -Modelle von OpenAI, Anthropic und Chinese AI Lab Deekeek übertreffen.

Bei einem anderen Test-Mess-Software-Devility-Fähigkeiten verifizierte SWE-Bench jedoch, dass Gemini 2.5 Pro 63,8%bewertet, die O3-Mini und Deepseeks R1 übertreffen, aber die Claude 3.7-Sonnet von Anthropic, die 70,3%erzielte, unterdurchschnittlich unterdurchschnittlich.

Bei der letzten Prüfung der Humanity, einem multimodalen Test, der aus Tausenden von Crowdsourced -Fragen zu Mathematik, Geisteswissenschaften und Naturwissenschaften besteht, laut Google erzielt Google 2,5 Pro mit 18,8%und erzielte besser als die meisten rivalisierenden Flaggschiff -Modelle.

Zu Beginn sagt Google, dass Gemini 2.5 Pro mit einem 1 -Million -Token -Kontextfenster versendet wird, was bedeutet, dass das KI -Modell in einem einzigen GO in etwa 750.000 Wörtern aufnehmen kann. Das ist länger als die gesamte Buchreihe „Lord of the Rings“. Und bald wird Gemini 2.5 Pro die doppelte Eingangslänge (2 Millionen Token) unterstützen.

Google hat keine API -Preisgestaltung für Gemini 2.5 Pro veröffentlicht. Das Unternehmen sagt, dass es in den kommenden Wochen mehr teilen wird.



Source link