OpenAI startet neue Tools, mit denen Unternehmen KI -Agenten aufbauen können


Am Dienstag veröffentlichte OpenAI neue Tools, mit denen Entwickler und Unternehmen AI -Agenten aufbauen sollen – automatisierte Systeme, die Aufgaben unabhängig erfüllen können – mithilfe der eigenen KI -Modelle und -Rahmenbedingungen des Unternehmens.

Die Tools sind Teil der neuen API von OpenAI, mit der Unternehmen benutzerdefinierte KI -Agenten entwickeln können OpenAI -Betreiberprodukt. Die Antworten -API ersetzt openai effektiv Assistenten APIwas das Unternehmen in der ersten Hälfte von 2026 Sonnenuntergang vorhat.

Der Hype um AI -Agenten ist in den letzten Jahren dramatisch gewachsen, obwohl die Tech -Industrie Schwierigkeiten hat, Menschen zu zeigen, oder sogar definierenwas „AI -Agenten“ wirklich sind. In dem jüngsten Beispiel des Hype des Agenten, der vor dem Nutzen läuft, wurde der chinesische Startup -Schmetterlingseffekt Anfang dieser Woche viral Für eine neue AI -Agenten -Plattform namens Manus Diese Nutzer entdeckten schnell nicht viele der Versprechen des Unternehmens.

Mit anderen Worten, die Einsätze sind für Openai hoch, um Agenten richtig zu machen.

“Es ist ziemlich einfach, Ihren Agenten zu demonstrieren”, sagte Olivier Godemont, Openais API -Produktleiter, in einem Interview gegenüber TechCrunch. “Ein Agent zu skalieren ist ziemlich schwierig und es ist sehr schwierig, die Leute dazu zu bringen, ihn oft zu benutzen.”

Anfang dieses Jahres führte Openai zwei AI -Agenten in ein in Chatgpt: Betreiber, der in Ihrem Namen Websites navigiert, und tiefe Forschungdie Forschungsberichte für Sie erstellt. Beide Tools gaben einen Einblick in die Erreichung der Agententechnologie, aber in der Abteilung „Autonomie“ einiges zu erwarten.

Mit der API der Antworten möchte OpenAI Zugang zu den Komponenten verkaufen, die AI-Agenten betreiben, sodass Entwickler ihre eigenen Agentenanwendungen im Forschungsstil aufbauen können. OpenAI hofft, dass Entwickler einige Anwendungen mit seiner Agenten -Technologie erstellen können, die sich autonomer fühlen als heute verfügbar.

Mit der API der Antworten können Entwickler auf die gleichen KI -Modelle (in der Vorschau) unter der Haube von OpenAI tippen Chatgpt -Suche Web-Search-Tool: GPT-4O-Suche und GPT-4O-Mini-Suche. Die Modelle können im Web nach Antworten auf Fragen durchsuchen und Quellen zitieren, wenn sie Antworten generieren.

OpenAI behauptet, dass die GPT-4O-Suche und die GPT-4O-Mini-Suche sachlich korrekt sind. Bei der SimpleQA-Benchmark des Unternehmens, die die Fähigkeit von Modellen misst, kurze, faktensuchende Fragen zu beantworten, bewertet GPT-4O-Such zu 90%, während GPT-4O-Mini-Such-Such zu 88% (höher ist besser). Zum Vergleich, GPT-4.5 – OpenAIs viel größeres, kürzlich veröffentlichtes Modell – Punkte nur 63%.

Die Tatsache, dass AI-betriebene Suchwerkzeuge genauer sind als herkömmliche KI-Modelle, ist nicht unbedingt überraschend-theoretisch kann die GPT-4O-Suche nur die richtige Antwort nachschlagen. Web -Suche jedoch macht Halluzinationen nicht zu einem gelösten Problem. Abgesehen von ihrer sachlichen Genauigkeit auch KI -Suchwerkzeuge neigen zu kämpfen Mit kurzen Navigationsanfragen (wie „Lakers Score heute“) und jüngsten Berichten deuten darauf hin, dass dies vorhanden ist Die Zitate von Chatgpt sind nicht immer zuverlässig.

Die Antworten -API enthält auch ein Dienstprogramm für Dateisuche, mit dem Dateien in den Datenbanken eines Unternehmens schnell gescannt werden können, um Informationen abzurufen. (OpenAI behauptet, dass es keine Modelle in diesen Dateien trainiert.) Außerdem können Entwickler, die die Antworten-API verwenden, auf das CUA-Modell (CORA-UNS-Agent) von OpenAI tippen, das den Bediener betreibt. Das Modell generiert Maus- und Tastaturaktionen, sodass Entwickler Computer verwenden können, die Aufgaben wie Dateneingabe und App -Workflows verwenden.

Laut OpenAI können Unternehmen das CUA -Modell optional ausführen, das lokal in ihren eigenen Systemen in der Forschungsvorschau veröffentlicht wird. Die Verbraucherversion der CUA, die im Betreiber verfügbar ist, kann nur Aktionen im Web ergreifen.

Um klar zu sein, die Antworten -API werden nicht alle technischen Probleme lösen, die die KI -Agenten heute plagen.

Während KI-betriebene Suchwerkzeuge genauer sind als herkömmliche KI AI Halluzinationen ein gelöstes Problem. Die GPT-4O-Suche erhält immer noch 10% der sachlichen Fragen falsch. Jenseits ihrer Genauigkeit neigen auch KI -Suchwerkzeuge dazu kämpfen mit kurzen Navigationsfragen (wie “Lakers Score heute”), und jüngste Berichte deuten darauf hin Die Zitate von Chatgpt sind nicht immer zuverlässig.

In einem Blog -Beitrag, der TechCrunch zur Verfügung gestellt wurde, sagte OpenAI, dass das CUA -Modell „noch nicht zuverlässig für die Automatisierung von Aufgaben zu Betriebssystemen“ ist und dass es anfällig dafür ist, „unbeabsichtigte“ Fehler zu machen.

OpenAI sagte jedoch, dass dies frühe Iterationen ihrer Agenten -Tools sind, und es arbeitet ständig daran, sie zu verbessern.

Neben der Antworten-API veröffentlicht OpenAI ein Open-Source-Toolkit namens Agents SDK, das Entwicklern kostenlose Tools bietet, um Modelle in ihre internen Systeme zu integrieren, Schutzmaßnahmen zu setzen und KI-Agentenaktivitäten für Debugging- und Optimierungszwecke zu überwachen. Die Agenten SDK ist eine Art Follow-up zu Openai’s Swarm, einem Rahmen für die Multi-Agent-Orchestrierung, die das Unternehmen Ende letzten Jahres veröffentlichte.

Godemont sagte, er hofft, dass Openai in diesem Jahr die Lücke zwischen AI -Agenten -Demos und Produkten überbrücken kann, und dass „Agenten seiner Meinung nach die wirkungsvollste Anwendung von KI sind, die passieren wird“. Das spiegelt einen CEO von Proclamation Openai, Sam Altman, im Januar an: Dass 2025 das Jahr ist, in dem AI -Agenten in die Belegschaft eintreten.

Unabhängig davon, ob 2025 wirklich zum „Jahr des AI -Agenten“ wird oder nicht, zeigen die neuesten Veröffentlichungen von OpenAI, dass das Unternehmen von auffälligen Agenten -Demos zu Wirkstools wechseln möchte.



Source link