Bluesky -Benutzer diskutieren Pläne über Benutzerdaten und KI -Schulungen


Social Network Bluesky in letzter Zeit veröffentlichte einen Vorschlag zu Github Neue Optionen skizzieren, um den Nutzern anzugeben, ob ihre Beiträge und Daten für Dinge wie generatives KI -Training und öffentliche Archivierung abgekratzt werden sollen.

CEO Jay Graber Erörterte den Vorschlag Anfang dieser Woche, während sie auf der Bühne in South bei Southwest, aber am Freitagabend frische Aufmerksamkeit erregt hat, nachdem sie Gepostet darüber auf Bluesky. Einige Benutzer reagierten alarmiert auf die Pläne des Unternehmens, die sie als Umkehrung von Blueskys früheren Beharrlichkeit, dass es angesehen wurde verkaufen Benutzerdaten nicht an Werbetreibende Und trainiert KI nicht auf Benutzerbeiträgen.

“Oh, verdammt nein!” die Benutzer -Skizzeette schrieb. „Das Schöne an dieser Plattform war das Nicht -Teilen von Informationen. Besonders Gen Ai. Höhle du jetzt nicht. “

Graber antwortete dass generative KI -Unternehmen „bereits öffentliche Daten aus dem gesamten Web abkratzen“, auch von Bluesky, da „alles auf Bluesky wie eine Website öffentlich ist“. Also sagte sie, Bluesky versuche, einen „neuen Standard“ zu erstellen, um das Kratzen zu regieren, ähnlich wie die Robots.txt Datei, auf denen Websites ihre Berechtigungen an Webcrawler weitergeben.

Debatten über KI -Training und Urheberrecht haben Robots.txt in das Scheinwerferlicht gezogenunter anderem die Tatsache hervorhebt, dass es nicht rechtlich durchsetzbar ist. Bluesky sucht seinen vorgeschlagenen Standard als einen ähnlichen „Mechanismus und Erwartungen“ und liefert „ein maschinenlesbares Format, von dem gute Akteure einhalten und das ethische Gewicht tragen, aber nicht rechtlich durchsetzbar sind“.

Unter dem Vorschlag, Benutzer der Bluesky -App oder andere Apps, die die zugrunde liegenden verwenden Atprotocolkönnte in ihre Einstellungen eingehen und die Verwendung ihrer Bluesky -Daten in vier Kategorien zulassen oder nicht verhindern: Generative KI, Protokollbrückung (dh die Verbindung verschiedener sozialer Ökosysteme), Bulk -Datensätze und Webarchivierung (wie die Wayback -Maschine des Internetarchivs).

Wenn ein Benutzer angibt, dass er nicht möchte, dass seine Daten zur Ausbildung generativer KI verwendet werden, heißt es in dem Vorschlag: „Unternehmen und Forschungsteams, die KI -Schulungssätze aufbauen, werden diese Absicht bei der Sichtweise entweder beim Kratzen von Websites oder beim Durchführen von Massenübertragungen mit dem Protokoll selbst erwarten.“

Molly White, der das Zitat schreibt, benötigt Newsletter und Web3, wird einfach ein großartiger Blog. beschrieben dies Als “ein guter Vorschlag” und sagte, es sei “seltsam zu sehen, dass die Leute Bluesky dafür flammen”, da es nicht so sehr “in der KI -Kratzung einladend” ist, sondern “versucht, ein Einverständnissignal hinzuzufügen, damit Benutzer Einstellungen für das bereits geschehene Schicksal vermitteln können”.

“Ich denke, die Schwäche in diesem und (kreativen Commons) ähnlichen Vorschlägen für” Präferenzsignale “ist, dass sie sich auf Schaber verlassen, um diese Signale aus einem Wunsch, gute Schauspieler zu sein, herauszufinden”, fuhr White fort. “Wir haben bereits einige dieser Unternehmen gesehen, die Robots.txt oder Piratenmaterial zum Kratzen angewachsen sind.”



Source link