KI -Chatbots anfällig für indirekte Einspritzangriffe, warnt der Forscher

admin Februarie 13, 2025

0 1 minute read

KI -Chatbots anfällig für indirekte Einspritzangriffe, warnt der Forscher

Einer der alarmierendsten Aspekte dieser Angriffe ist ihre Fähigkeit, den Langzeitgedächtnis des Chatbot (Datei) zu beschädigen

Einer der alarmierendsten Aspekte dieser Angriffe ist ihre Fähigkeit, den Langzeitgedächtnis (Datei) des Chatbots zu beschädigen Fotokredit: Reuters

Auf dem sich schnell entwickelnden Bereich der künstlichen Intelligenz ist eine neue Sicherheitsbedrohung aufgetreten, die den Kern des Betriebs der KI -Chatbots abzielte. Die indirekte schnelle Injektion, eine Technik, die Chatbots zur Ausführung böswilliger Befehle manipuliert, ist für Entwickler und Benutzer gleichermaßen zu einem erheblichen Anliegen geworden. Trotz der Bemühungen von Tech -Giganten wie Google und Openai, ihre Systeme zu stärken, nutzen Hacker weiterhin Schwachstellen, was zu potenziellen Datenverletzungen und Fehlinformationen führt.

Die indirekte schnelle Injektion nutzt die inhärente Natur von Großsprachenmodellen (LLMs), um Anweisungen zu befolgen, die in den von ihnen verarbeitenden Inhalt eingebettet sind. Diese Methode wurde kürzlich vom Cybersicherheitsforscher Johann Rehberger hervorgehoben, der zeigte, wie Googles Gemini -Chatbot von Google manipuliert werden konnte. Durch die Einbettung böswilliger Anweisungen in scheinbar gutartige Dokumente oder E-Mails können Angreifer Chatbots dazu veranlassen, nicht autorisierte Aktionen auszuführen, z. B. die Suche nach sensiblen Informationen oder die Änderung von Einstellungen für Langzeitgedächtnisse.

Die jüngste Demonstration von Herrn Rehberger führt eine ausgefeilte Technik ein, die als „verzögerter Werkzeugaufruf“ bezeichnet wird. Diese Methode erhebt die Ausführung böswilliger Anweisungen zu bestimmten Benutzeraktionen, wodurch der Angriff verdeckter und schwer zu erkennen ist. Beispielsweise kann ein Dokument den Chatbot anweisen, nur dann nach sensiblen Daten zu suchen, wenn der Benutzer mit bestimmten Triggerwörtern antwortet. Dieser Ansatz umgeht die vorhandene Abwehrkräfte, indem sie die böswillige Aktivitäten mit legitimen Benutzerinteraktionen ausrichten.

Einer der alarmierendsten Aspekte dieser Angriffe ist ihre Fähigkeit, das langfristige Gedächtnis des Chatbots zu beschädigen. Bei einem POC-Angriff (Proof-of-Concept) zeigte Herr Rehberger, wie ein bösartiges Dokument falsche Erinnerungen an Gemini Advanced, einer Premium-Version von Googles Chatbot, annehmen konnte. Diese einst etablierten Erinnerungen bestehen in allen zukünftigen Sitzungen und führen möglicherweise den Chatbot dazu, auf unbestimmte Zeit auf falsche Informationen zu reagieren. Diese Manipulation beeinträchtigt nicht nur Benutzerdaten, sondern untergräbt auch die Zuverlässigkeit des KI -Systems.

Wenn KI -Chatbots zunehmend in das tägliche Leben integriert werden, ist die Sicherheit dieser Systeme von größter Bedeutung. Der anhaltende Kampf zwischen Entwicklern und Hackern unterstreicht die Notwendigkeit kontinuierlicher Innovationen in der KI -Sicherheit. Während aktuelle Minderungen einen gewissen Schutz bieten, bleibt die grundlegende Frage der indirekten schnellen Injektion ungelöst.

Veröffentlicht – 13. Februar 2025 14:47 Uhr IST

Source link

admin Februarie 13, 2025

0 1 minute read

KI -Chatbots anfällig für indirekte Einspritzangriffe, warnt der Forscher

admin

Rapport: Ex-Oriole Brian Matusz stierf aan een waarschijnlijke overdosis drugs

Anthropische Forscher teilen die Überraschungen, die sie beobachtet haben, als sie Claude denken: Voraussetzung, Verwirrung zwischen Sicherheit und Hilfsbereitschaft, Lügen, mehr (Steven Levy/Wired).

Gemeenschappen versterken door middel van financiële geletterdheid: de missie van Fenian Financials

Verslag uit Beiroet: Israël bombardeert banken, valt UNIFIL aan in de uitbreiding van de agressieoorlog

Tyler Mitchells Liebesbrief zum modernen schwarzen Dandyismus

Google verlaagt dei-inspanningen en het inhuren van doelen, na de anti-diversiteit van Trump na Trump

admin

Subscribe to our mailing list to get the new updates!

Akute Belastungsstörung gegen PTBS: Wann wird das Trauma chronisch?

Tyler Perkins schlägt einen spielgewinnenden 3-Zeiger

Related Articles

Was Sie von Google I/O 2025 erwarten können – die Vorhersagen strömen ein

Töten Sie Anzeigen auf jeder Website und jedem Gerät mit Adguards lebenslanger Plan

Jeder mit einem PayPal -Konto hat auf rote Alarmbereitschaft gelegt und aufgefordert, 10 neue Regeln einzuhalten

Der in NYC ansässige Healthee, dessen KI-Assistent Zoe die Mitarbeiter seiner Kunden durch Krankenversicherungs- und Leistungsoptionen navigieren, sammelte eine von Key1 Capital (Erin Brodwin/Axios) geleitete Serie B in Höhe von 50 Millionen US-Dollar.