ICHIch beobachte künstliche Intelligenz meine Lebensmittel. Mit meiner Einkaufsliste sind jeden Artikel in die Suchleiste einer Supermarktwebsite eingebracht und verwendet dann den Cursor, um zu klicken. Wenn man beobachtet, was ein digitaler Geist zu sein scheint, ist dies normalerweise eine weltliche Aufgabe, die seltsamerweise ist. “Bist du sicher, dass es nicht nur eine Person in Indien ist?” Fragt mein Mann und spähte über meine Schulter.
Ich versuche es aus Operatorein neuer KI “Agent” von Openai, dem Hersteller von Chatgpt. Sie haben den britischen Benutzern im letzten Monat eine ähnliche Textoberfläche und einen Gesprächston wie ChatGPT zur Verfügung gestellt, aber anstatt nur Fragen zu beantworten, kann dies tatsächlich tatsächlich Tun Dinge – vorausgesetzt, sie beinhalten das Navigieren eines Webbrowsers.
KI -Agenten, die sich von großer Sprachmodellen auf die Fersen befinden, wurden als nächstes großes Ding tromponiert, und Sie können den Reiz sehen: Ein digitaler Assistent, der praktische Aufgaben erledigen kann, ist überzeugender als einer, der einfach zurückreden kann. Ähnlich wie das Angebot von OpenAI führte Anthropic gegen Ende letzten Jahres die Funktionen der „Computer -Nutzung“ in den Claude -Chatbot ein. Verwirrung und Google haben auch “Agentic” -Funktionen in ihre KI -Assistenten veröffentlicht, wobei weitere Unternehmen sich auf bestimmte Aufgaben wie Codierung oder Forschung entwickeln.
Es gibt eine Debatte darüber, was genau als KI -Agent gilt, aber die allgemeine Idee ist, dass sie in der Lage sein müssen, Maßnahmen mit einem gewissen Grad an Autonomie zu ergreifen. “Sobald etwas außerhalb des Chat -Fensters Aktionen ausführt, ist es von Chatbot zu einem Agenten geworden”, sagt Margaret Mitchell, Chef -Ethikwissenschaftlerin bei der AI -Firma, die das Gesicht umarmt.
Es sind frühe Tage. Die meisten im Handel erhältlichen Agenten sind mit einem Haftungsausschluss ausgestattet, dass sie immer noch experimentell sind – OpenAI beschreibt den Betreiber als „Forschungsvorschau“ – und Sie können viele Beispiele online finden, wenn sie amüsante Fehler machen, z. B. Ausgaben $ 31 auf ein Dutzend Eiern oder versuchen Liefern Sie Lebensmittel zurück in den Laden Sie kauften sie von. Abhängig davon, wen Sie fragen, sind Agenten nur das nächste überprüfte Tech -Spielzeug oder die Morgendämmerung einer KI -Zukunft, die die Belegschaft aufrütteln, das Internet neu verändern und unsere Leben ändern könnte.
„Grundsätzlich wären sie erstaunlich, weil sie viel Plackerei automatisieren könnten“, sagt Gary Marcus, Wissenschaftler und Skeptiker großer Sprachmodelle. “Aber ich glaube nicht, dass sie bald zuverlässig arbeiten werden, und es ist teilweise eine Investition in Hype.”
Ich melde mich für den Bediener an, um es selbst zu sehen. Ohne Essen im Haus scheint das Einkauf von Lebensmitteln eine gute erste Aufgabe zu sein. Ich tippe meine Anfrage ein und sie fragt, ob ich einen bevorzugten Laden oder eine bevorzugte Marke habe. Ich sage es, dass es am billigsten ist. Ein Fenster wird angezeigt, das einen Webbrowser zeigt, und ich sehe die Suche nach “UK Online -Lebensmittelzustellung”. Ein Mauscursor wählt das erste Ergebnis aus: Ocado. Es sucht nach meinen angeforderten Artikeln und filtert die Ergebnisse nach dem Preis. Es wählt Produkte aus und klickt auf „zu Trolley hinzufügen“.
Ich bin beeindruckt von der Initiative des Bedieners. Es polwt mich nicht mit Fragen und trifft stattdessen eine Führungsentscheidung, wenn ich nur eine kurze Artikelnbeschreibung wie „Lachs“ oder „Hühnchen“ erhält. Bei der Suche nach Eiern scrollen Sie erfolgreich an mehreren Nicht-Ei-Artikeln vorbei, die als Sonderangebote erscheinen. Meine Liste bittet nach „ein paar verschiedenen Gemüse“: Sie wählt einen Brokkoli -Kopf aus und fragt dann, ob etwas anderes Spezifisches möchte. Ich sage es, dass er zwei weitere auswählt, und es gilt für Karotten und Lauch – wahrscheinlich, was ich mich ausgewählt hätte. Ermutigt, ich sage es, dass er “einen süßen Leckerbissen” hinzufügt und beobachten soll, wie es buchstäblich „süße Leckereien“ in die Suchleiste eingreift. Ich bin mir nicht sicher, warum es 70% Schokolade auswählt – sicherlich nicht die billigste Option -, aber ich sage es, dass ich dunkle Schokolade nicht mag und es für eine Galaxienstange ausgeht.
Wir haben einen Haken getroffen, als der Betreiber erkennt, dass Ocado einen Mindestausgaben hat. Daher füge ich der Liste weitere Artikel hinzu. Dann kommt es zum Anmelden und der Agent fordert mich auf, einzugreifen: Während Benutzer den Browser zu jedem Zeitpunkt übernehmen können, ist OpenAI so konzipiert, dass der Betreiber dies „beim Eingeben vertraulicher Informationen in den Browser wie Login -Anmeldeinformationen oder Zahlungsinformationen“ anfordern. Obwohl der Bediener normalerweise ständige Screenshots aufnimmt, um zu „sehen“, was es tut, sagt Openai nicht, wenn ein Benutzer die Kontrolle übernimmt.
An der Kasse teste ich das Wasser, indem ich den Betreiber auffordert, die Zahlung abzuschließen. Ich übernehme jedoch die Zügel zurück, wenn sie antwortet, indem ich nach meinen Kartendaten frage. Ich habe OpenAI bereits meine Zahlungsinformationen gegeben (Betreiber benötigt ein Chatgpt -Pro -Konto, das 200 US -Dollar pro Monat kostet), aber es ist mir unangenehm, dies direkt mit einer KI zu teilen. Bestellung aufgestellt, ich warte meine Lieferung am nächsten Tag. Aber das löst das Abendessen nicht. Ich gebe Operator eine neue Aufgabe: Kann es mir einen Cheeseburger und Chips von einem lokalen, hoch bewerteten Restaurant bestellen? Es bittet nach meiner Postleitzahl, lädt dann die Deliveroo -Website und sucht nach „Cheeseburger“. Auch hier gibt es eine Pause, wenn ich mich anmelden muss, aber da Delipoo bereits meine Kartendaten gespeichert hat, kann der Betreiber direkt zur Zahlung fortfahren.
Das Restaurant, das es auswählt, ist lokal und ist hoch bewertet – als Fisch- und Chip -Shop. Am Ende habe ich einen passablen Cheeseburger und eine große Tüte mit Chips im Chippy-Stil. Nicht genau das, was ich mir vorgestellt hatte, aber nicht falschentweder. Ich bin jedoch beschämt, wenn ich feststelle, dass der Betreiber über das Trinkgeld des Lieferfahrers übersprungen wurde. Ich nehme verlegen mein Essen und füge danach eine großzügige Spitze hinzu.
Natürlich besiegt das Beobachten von Bediener in Aktion den zeitsparenden Punkt der Verwendung eines KI-Agenten für Online-Aufgaben. Stattdessen können Sie es im Hintergrund funktionieren lassen, während Sie sich auf andere Registerkarten konzentrieren. Während ich dieses Stück entworfen habe, stelle ich eine weitere Anfrage: Kann es mir eine Gel -Maniküre in einem örtlichen Salon buchen?
Der Bediener kämpft mehr mit dieser Aufgabe. Es geht an die Beauty Booking Platform Fresha, aber als es mich zum Anmelden auffordert, sehe ich, dass es einen Termin eine Woche zu spät und mehr als eine Stunde Fahrt von meinem Haus in Ost -London entfernt hat. Ich weise auf diese Probleme hin und es findet einen Slot für das richtige Datum, aber auf dem Leicester Square – immer noch eine Entfernung entfernt. Erst dann fragt es meinen Standort und ich merke, dass es dieses Wissen zwischen Aufgaben nicht beibehalten haben darf. Zu diesem Zeitpunkt hätte ich bereits meine eigene Buchung vornehmen können. Der Betreiber schlägt schließlich einen geeigneten Termin vor, aber ich verlasse die Aufgabe und kreiste sie als Sieg für Team Human.
Es ist klar, dass diese erste Generation von AI -Agenten Einschränkungen hat. Wenn man anhalten und sich anmelden muss, ist eine Menge menschlicher Aufsicht erforderlich, obwohl der Betreiber Cookies speichert, damit Benutzer bei nachfolgenden Besuchen auf Websites angemeldet bleiben können (OpenAI erfordert eine genauere Aufsicht auf „besonders sensiblen“ Websites wie E -Mail -Kunden oder Finanzdienstleistungen). Die Ergebnisse, obwohl sie normalerweise genau sind, sind nicht immer das, was ich im Sinn habe. Wenn meine Lebensmittel ankommen, stelle ich fest, dass der Betreiber geräucherter Lachs anstelle von Filets bestellt und Joghurt verdoppelt hat, möglicherweise wegen eines Sonderangebots. Es interpretierte „einige Fischkuchen“ als drei Packungen (ich beabsichtigte nur eine) und wurde nur die Empörung des Kaufs von Schokoladenmilch anstelle von einfacher, da das Produkt nicht vorrätig war. Um dem Bot fair zu sein, hatte ich die Gelegenheit, die Bestellung zu überprüfen, und ich hätte bessere Ergebnisse erzielt, wenn ich in meinen Eingabeaufforderungen spezifischer gewesen wäre („eine Packung von zwei rohen Lachsfilets“) – aber diese zusätzlichen Schritte würden auch die gespeicherten Anstrengungen beeinträchtigen.
Trotz der aktuellen Mängel fühlt sich meine Erfahrung mit dem Bediener wie ein Blick auf etwas. Als solche Systeme verbessern sich und senken ich die Kosten leicht, wenn sie leicht sehen, dass sie in den Alltag eingebettet wurden. Möglicherweise schreiben Sie Ihre Einkaufsliste bereits in eine App. Warum sollte es nicht auch die Bestellung aufgeben? Agenten infiltrieren auch Workflows über den Bereich eines persönlichen Assistenten hinaus. Der Geschäftsführer von OpenAI, Sam Altman, hat vorhergesagt dass KI -Agenten dieses Jahr „der Belegschaft anschließen“ könnten.
Softwareentwickler gehören zu den frühen Anwendern. Codierungsplattform GitHub kürzlich hinzugefügte Agentenfunktionen zu seinem KI -Copilot -Werkzeug. Der CEO von Github, Thomas Dohmke, sagt, dass Entwickler ein gewisses Maß an automatisierter Unterstützung gewöhnt sind. Der Unterschied zu AI -Agenten ist das Niveau der Autonomie. “Anstatt dass Sie nur eine Frage stellen, gibt es Ihnen eine Antwort, Sie geben ihr ein Problem und dann iteriert es dieses Problem zusammen mit dem Code, auf den es Zugriff hat”, sagt er.
Github arbeitet bereits an einem Agenten mit größerer Autonomie, den es Project Padawan (a) nennt Star Wars Begriff in Bezug auf einen Jedi -Lehrling). Dies würde es einem AI -Agenten ermöglichen, asynchron zu arbeiten, anstatt ständige Kontrolle zu benötigen. Ein Entwickler könnte sich mit Teams von Agenten melden lassen, die ihnen den Code für seine Überprüfung produzieren. Dohmke sagt, er glaube nicht, dass die Arbeitsplätze der Entwickler gefährdet sind, da ihre Fähigkeiten eine zunehmende Nachfrage finden. “Ich würde argumentieren, dass die Arbeit, die die KI dem Backlog der meisten Entwickler hinzugefügt hat, höher ist als die Menge an Arbeit, die sie übernommen hat”, sagt er. Agenten könnten auch Codierungsaufgaben erledigen, wie z. B. das Erstellen einer App, die für nichttechnische Menschen zugänglicher ist.
DOHMKE Outside Softwareentwicklung stellt sich eine Zukunft vor, wenn jeder seinen eigenen persönlichen Jarvis hat, die sprechende KI in Iron Man. Ihr Agent lernt Ihre Gewohnheiten und wird an Ihren Geschmack angepasst, was es nützlicher macht. Er würde seine benutzen, um Feiertage für seine Familie zu buchen.
Die stärkeren Autonomie -Wirkstoffe haben jedoch die größeren Risiken, die sie ausgehen. Mitchell, vom Umarmungsgesicht, Mitautorisierte ein Papier Warnung gegen die Entwicklung vollständig autonomer Agenten. “Vollautonom bedeutet, dass die menschliche Kontrolle vollständig abgetreten wurde”, sagt sie. Anstatt innerhalb von festgelegten Grenzen zu arbeiten, kann ein vollständig autonomer Agent Zugang zu Dingen erhalten, die Sie nicht auf unerwartete Weise erkennen oder verhalten, insbesondere wenn er seinen eigenen Code schreiben kann. Es ist keine große Sache, wenn ein AI -Agent Ihre Takeout -Bestellung falsch versteht, aber was ist, wenn er anfängt, Ihre persönlichen Daten mit Betrugswebsites zu teilen oder schreckliche Social -Media -Inhalte unter Ihrem Namen zu veröffentlichen? Hochrisikorische Arbeitsplätze könnten besonders gefährliche Szenarien einführen: Was ist, wenn es auf ein Raketenbefehlssystem zugreifen kann?
Mitchell hofft, dass Technologen, Gesetzgeber und politische Entscheidungsträger Leitplanken dazu anregen, solche Vorfälle zu mildern. Im Moment sieht sie vor, dass die Fähigkeiten der Agenten für bestimmte Aufgaben raffinierter werden. Bald, sagt sie, wir werden sehen, wie Agenten mit Agenten interagieren – Ihr Agent könnte beispielsweise mit meiner zusammenarbeiten, um ein Meeting abzurichten.
Diese Verbreitung von Wirkstoffen könnte das Internet neu gestalten. Derzeit sind viele Informationen online auf menschliche Sprache spezialisiert. Wenn AIS jedoch zunehmend mit Websites interagiert, könnte sich dies ändern. “Wir werden immer mehr Informationen über das Internet sehen, das nicht direkt menschliche Sprache ist, sondern die Informationen, die für einen Agenten notwendig wären, um darauf zu reagieren”, sagt Mitchell.
Dohmke wiederholt diese Idee. Er glaubt, dass das Konzept der Homepage an Bedeutung verlieren wird und Schnittstellen mit Blick auf KI -Agenten konzipiert werden. Marken können sich um die Aufmerksamkeit von KI gegenüber menschlichen Augäpfeln konkurrieren.
Eines Tages können Agenten sogar den Grenzen des Computers entkommen. Wir konnten KI -Agenten sehen, die in Robotern verkörpert wurden, die eine Welt von physischen Aufgaben öffnen würden, damit sie helfen konnten. „Meine Vorhersage ist, dass wir Agenten sehen, die unsere Wäsche für uns waschen und unsere Gerichte machen und uns zum Frühstück machen können“, sagt Mitchell. “Geben Sie ihnen einfach keinen Zugang zu Waffen.”
Source link