Nehmen Sie an unseren täglichen und wöchentlichen Newslettern teil, um die neuesten Updates und exklusiven Inhalte zur Berichterstattung über branchenführende KI zu erhalten. Erfahren Sie mehr
Das Modellkontextprotokoll (MCP) – ein steigender offener Standard, der AI -Agenten dabei helfen soll, nahtlos mit Tools, Daten und Schnittstellen zu interagieren – trifft nur einen signifikanten Meilenstein. Heute haben Entwickler hinter der Initiative eine aktualisierte Version der MCP -Spezifikation abgeschlossen, in der wichtige Upgrades eingeführt wurden, um KI -Agenten sicherer, fähiger und interoperabler zu gestalten.
(Update: In einem sehr bedeutenden Schritt folgte OpenAI, der Branchenführer in generativen KI, der MCP sagte, die Unterstützung sei heute verfügbar In OpenAIs Agenten SDK und diese Unterstützung für die Desktop -App von Chatgpt und die API der Antworten werden bald kommen.)
In einem bemerkenswerten Schritt, Microsoft Auch kürzlich die Unterstützung für MCP zusammen mit dieser Veröffentlichung angekündigt, einschließlich des Starts eines neuen Dramatiker-MCP-Server Dadurch können KI -Agenten wie Claude im Internet durchsuchen und mit Websites mit dem Chrome Barrierefreiberbaum interagieren.
“Diese neue Version ist ein wichtiger Sprung für die Agent-Tool-Kommunikation”, sagte Alex Albert, ein wichtiger Beitrag zum MCP-Projekt, sagte in einem Beitrag auf Twitter. “Und Microsoft baut reale Infrastruktur auf, zeigt, wie schnell sich dieses Ökosystem weiterentwickelt.“
Was ist neu in der aktualisierten MCP Version?
Das Update vom 26. März bringt mehrere wichtige Änderungen auf Protokollebene mit sich:
- OAuth 2.1-basierter Autorisierungsrahmen: Fügt einen robusten Standard für die Sicherung der Kommunikation zur Agenten-Server hinzu, insbesondere in HTTP-basierten Transporten.
- Streamabler HTTP -Transport: Ersetzt das ältere HTTP+SSE-SETUP und ermöglicht den bidirektionalen Datenfluss in Echtzeit mit einer besseren Kompatibilität.
- JSON-RPC-Batching: Ermöglicht Clients, mehrere Anfragen auf einmal zu senden, die Effizienz zu verbessern und die Latenz in Agent-Tool-Interaktionen zu verringern.
- Werkzeuganmerkungen: Fügt reichhaltige Metadaten für die Beschreibung des Werkzeugverhaltens hinzu und ermöglicht eine fantasieere Entdeckung und Argumentation durch KI -Agenten.
Abbildung 1: Claude-Desktop mit Dramatikern-MCP zum Navigieren und Beschreiben von Datasette.io, wodurch die vom Modellkontextprotokoll betriebene Webautomatisierung demonstriert wird.
Das Protokoll verwendet eine modulare JSON-RPC 2.0-Basis, wobei eine geschichtete Architektur Kerntransport, Lebenszyklusverwaltung, Serverfunktionen (wie Ressourcen und Eingabeaufforderungen) und Client-Funktionen (wie Probenahme oder Protokollierung) trennt. Entwickler können je nach Anwendungsfall auswählen, welche Komponenten implementiert werden sollen.
Der Beitrag von Microsoft: Browserautomatisierung über MCP
Einen Tag vor dem MCP -Update veröffentlichte Microsoft Dramatiker-MCPein Server, der sein leistungsstarkes Browser -Automatisierungs -Tool im MCP -Standard einbindet. Dies bedeutet, dass AI -Agenten wie Claude jetzt mehr als nur sprechen können – sie können wie ein echter Benutzer klicken, tippen, durchsuchen und mit dem Web interagieren.
Die Integration basiert auf dem Tree Accomome Barrierefreiheit und ermöglicht Claude, auf den Seiteninhalt in einer menschlich lesbaren Form zuzugreifen und zu beschreiben. Das verfügbare Toolset enthält:
- Navigation: browser_navigate, go_back, go_forward
- Eingang: browser_type, browser_click, browser_press_key
- Schnappschüsse: browser_snapshot, browser_screenshot
- Elementbasierte Interaktionen Verwenden von Barrierefreiheit Deskriptoren
Dies verwandelt jeden konformen AI -Agenten in einen Testautomations -Bot, QA -Assistent oder Daten -Navigator.
Die Menschen lieben MCP und wir freuen uns, unsere Produkte zu unterstützen.
Heute in den Agenten SDK und Unterstützung für die Chatgpt -Desktop -App + Antworten API in Kürze!
– Sam Altman (@SAMA) 26. März 2025
Setup ist einfach: Benutzer fügen Dramatiker einfach als Befehl in Claude_Desktop_config.json hinzu, und die Claude -Desktop -App erkennt die Tools zur Laufzeit.
Das Gesamtbild: Interoperabilität in Skala
Abbildung 2: Mit dem modularen Design von MCP können Entwickler nur die von ihnen benötigten Ebenen implementieren und gleichzeitig die Kompatibilität beibehalten.
Anthropisch zuerst eingeführt MCP Ende 2023, um einen wachsenden Schmerzpunkt zu lösen: KI-Agenten müssen mit tatsächlichen Werkzeugen interagieren, aber jede App spricht eine andere „Sprache“. MCP zielt darauf ab, dies zu beheben, indem ein gemeinsames Protokoll zur Beschreibung und Verwendung von Tools in allen Ökosystemen bereitgestellt wird.
Mit der Unterstützung von Anthropic, Langchain und jetzt Microsoft entwickelt sich MCP als ernsthafter Anwärter, um zur Standardschicht der Agentenverbindung zu werden. MCP wurde zuerst von Anthropic gestartet, und daher verweilten die Fragen, ob Anthropics größter Konkurrent Openai das Protokoll unterstützen würde. Und natürlich war Microsoft, ein großer Verbündeter von Openai, ein weiteres Fragezeichen. Die Tatsache, dass beide Spieler das Protokoll unterstützt haben, zeigt, dass der Dynamik zwischen Unternehmens- und Open-Source-Gemeinschaften aufbaut.
“Wir betreten die Protokoll -Ära der KI”, ” getwittert Alexander Doria, Mitbegründer von AI Startup Pleias. „So werden Agenten tatsächlich werden Tun Dinge.”
Was kommt als nächstes?
Mit der Veröffentlichung von MCP 0.2 und Microsofts greifbarer Unterstützung wird die Grundlagen für eine neue Generation von Agenten gelegt, die sicher und flexibel über den Stapel denken und flexibel handeln können.
Abbildung 3: OAuth 2.1 Autorisierungsfluss im Modellkontextprotokoll (MCP)
Die große Frage ist jetzt: Werden andere folgen? Wenn sich Meta, Amazon oder Apple anmelden, könnte MCP bald die universelle „Sprache“ von AI -Aktionen werden.
Im Moment ist es ein großer Tag für das Agent -Ökosystem – eines, das das Versprechen der KI -Interoperabilität näher an die Realität bringt.
Source link