83 jaar geleden resoneert de voorspelling van een sciencefictionschrijver over een komende contentcrisis vandaag de dag griezelig


Hoe zal het internet zich de komende decennia ontwikkelen?

Fictieschrijvers hebben enkele mogelijkheden onderzocht.

In zijn roman uit 2019 “Val”, sciencefictionauteur Neal Stephenson stelde zich een nabije toekomst voor waarin het internet nog steeds bestaat. Maar het is zo vervuild geraakt door desinformatie, desinformatie en reclame dat het grotendeels onbruikbaar is.

Personages in Stephensons roman gaan met dit probleem om door zich te abonneren op 'edit streams': door mensen geselecteerd nieuws en informatie die als betrouwbaar kunnen worden beschouwd.

De waarheid is daarbuiten – maar dat geldt ook voor elke denkbare onwaarheid.

Het nadeel is dat alleen de rijken zich dergelijke op maat gemaakte diensten kunnen veroorloven, waardoor het grootste deel van de mensheid ongecontroleerde online-inhoud van lage kwaliteit moet consumeren.

Tot op zekere hoogte is dit al gebeurd: veel nieuwsorganisaties, zoals De New York Times En De Wall Street Journalhebben hun samengestelde inhoud achter betaalmuren geplaatst. In de tussentijd, desinformatie woekert op sociale mediaplatforms zoals X en TikTok.

Stephensons staat van dienst als voorspeller is indrukwekkend anticipeerde op de metaverse in zijn roman uit 1992 “Sneeuwcrash”, en een belangrijk plotelement van zijn “Diamant tijdperk”, uitgebracht in 1995, is een interactieve primer die functioneert lijkt veel op een chatbot.

Oppervlakkig gezien lijken chatbots een oplossing te bieden voor de desinformatie-epidemie. Door feitelijke inhoud te verstrekken, kunnen chatbots alternatieve bronnen van hoogwaardige informatie leveren die niet zijn afgeschermd door betaalmuren.

De schrijver en Nobelprijs voor de Literatuur, Jorge Luis Borges, heeft de grote taalmodellen misschien niet voorspeld, maar hij had ons wel kunnen vertellen wat er daarna komt.

Europa Persarchief/Europa Pers/Getty Images

Ironisch genoeg zou de output van deze chatbots echter wel eens het grootste gevaar kunnen vormen voor de toekomst van het internet – een gevaar waar decennia eerder al op werd gezinspeeld door de Argentijnse schrijver. Jorge Luis Borges.

De opkomst van de AI-chatbot

Tegenwoordig bestaat een aanzienlijk deel van het internet nog steeds uit feitelijke en ogenschijnlijk waarheidsgetrouwe inhoud, zoals artikelen en boeken die door vakgenoten zijn beoordeeld, op feiten zijn gecontroleerd of op een of andere manier zijn doorgelicht.

De ontwikkelaars van grote taalmodellen, of LLM's – de motoren die bots als ChatGPT, Copilot en Gemini aandrijven – hebben van deze hulpbron geprofiteerd.

Het probleem is dat het web, hoe enorm het ook is, een eindige hulpbron is.

Om hun magie uit te voeren, moeten deze modellen echter inslikken enorme hoeveelheden van hoogwaardige tekst voor trainingsdoeleinden. Er is al een enorme hoeveelheid woordenstroom uit online bronnen gehaald en aan de jonge LLM's doorgegeven.

Het probleem is dat het web, hoe enorm het ook is, een eindige hulpbron is. Tekst van hoge kwaliteit die nog niet is gestript, is dat wel schaars wordenwat leidde tot wat The New York Times een ‘opkomende inhoudelijke crisis.”

Dit heeft bedrijven als OpenAI daartoe gedwongen overeenkomsten aangaan met uitgevers om nog meer grondstoffen te verkrijgen voor hun vraatzuchtige bots. Volgens één voorspelling zou er echter een tekort aan aanvullende trainingsgegevens van hoge kwaliteit kunnen ontstaan al in 2026.

Naarmate de output van chatbots online belandt, worden deze teksten van de tweede generatie – compleet met verzonnen informatie genaamd ‘hallucinaties”, evenals regelrechte fouten, zoals suggesties om doe lijm op je pizza – zal het internet verder vervuilen.

En als een chatbot online met de verkeerde soort mensen omgaat, kan hij hun weerzinwekkende opvattingen oppikken. Microsoft ontdekte dit op de harde manier in 2016 toen het moest de stekker uit Tay trekkeneen bot die begon te herhalen racistische en seksistische inhoud.

Na verloop van tijd kunnen al deze problemen ervoor zorgen dat de online-inhoud gelijk wordt minder betrouwbaar en minder nuttig dan nu. Bovendien kunnen LLM's die een dieet met weinig calorieën krijgen, een nog problematischer resultaat produceren dat ook op internet terechtkomt.

De nutteloze bibliotheek

Het is niet moeilijk om je een feedbacklus voor te stellen die resulteert in een continu proces van degradatie terwijl de bots zich voeden met hun eigen imperfecte output.

Een artikel uit juli 2024 gepubliceerd in Nature onderzocht de gevolgen van het trainen van AI-modellen op recursief gegenereerde gegevens. Het toonde aan dat “onomkeerbare defecten” kunnen leiden tot “modelinstorting' voor systemen die op deze manier zijn getraind – net zoals de kopie van een afbeelding en een kopie van die kopie, en een kopie van die kopie, de trouw aan de originele afbeelding zal verliezen.

Hoe erg kan dit worden?

Denk eens aan het korte verhaal van Borges uit 1941 “De bibliotheek van Babel.” Vijftig jaar vóór computerwetenschapper Tim Berners-Lee de architectuur voor het web creëerde, had Borges zich al een analoog equivalent voorgesteld.

In zijn verhaal van 3000 woorden stelt de schrijver zich een wereld voor die bestaat uit een enorm en mogelijk oneindig aantal zeshoekige kamers. De boekenplanken in elke kamer bevatten uniforme volumes die, zo vermoeden de bewoners, elke mogelijke permutatie van letters in hun alfabet moeten bevatten.

In eerste instantie schenkt dit besef vreugde: er moeten per definitie boeken bestaan ​​die de toekomst van de mensheid en de zin van het leven gedetailleerd beschrijven.

De inwoners zoeken naar dergelijke boeken, maar ontdekken dat de overgrote meerderheid niets anders bevat dan betekenisloze lettercombinaties. De waarheid is daarbuiten – maar dat geldt ook voor elke denkbare onwaarheid. En dit alles is ingebed in een onvoorstelbaar grote hoeveelheid onzin.

Zelfs na eeuwenlang zoeken zijn er slechts enkele betekenisvolle fragmenten gevonden. En zelfs dan is er geen manier om te bepalen of deze samenhangende teksten waarheden of leugens zijn. Hoop verandert in wanhoop.

Zal het internet zo vervuild raken dat alleen de rijken zich nauwkeurige en betrouwbare informatie kunnen veroorloven? Of zal een oneindig aantal chatbots zoveel bedorven woordenstroom produceren dat het vinden van nauwkeurige informatie online een zoeken naar een speld in een hooiberg wordt?

Het internet wordt vaak omschreven als een van de grootste verworvenheden van de mensheid. Maar net als bij elke andere hulpbron is het belangrijk om serieus na te denken over de manier waarop deze wordt onderhouden en beheerd – om te voorkomen dat we uiteindelijk geconfronteerd worden met de dystopische visie van Borges.

Dit artikel is oorspronkelijk gepubliceerd op Het gesprek door Roger J. Kreuz aan de Universiteit van Memphis. Lees de origineel artikel hier.



Source link