Al meer dan twee jaar staat elke nieuwe AI-aankondiging in de schaduw van ChatGPT. Geen enkel model van welk bedrijf dan ook heeft die aanvankelijke koorts overschaduwd of geëvenaard. Maar misschien is een bedrijf afgelopen februari wel het dichtst in de buurt gekomen van het repliceren van de buzz, toen OpenAI voor het eerst zijn video-genererende AI-model, Sora, plaagde. Prikkelende clips – wolharige mammoeten die sneeuwwolken opdrijven, Pixar-achtige animaties van schattige pluizige beestjes – beloofden een verbluffende toekomst, waarin iedereen clips van hoge kwaliteit kan maken door eenvoudige tekstprompts in een computerprogramma te typen.
Maar Sora, dat niet onmiddellijk beschikbaar was voor het publiek, bleef precies dat: een teaser. De druk op OpenAI is toegenomen. In de tussenliggende maanden hebben verschillende andere grote technologiebedrijven, waaronder Meta, Google en Amazon, hun eigen videogenererende modellen tentoongesteld. Vandaag reageerde OpenAI eindelijk. “Dit is een lancering waar we al heel lang naar uitkijken”, zei de CEO van de start-up, Sam Altman, in een aankondigingsvideo. “We gaan Sora lanceren, ons videoproduct.”
In de aankondiging zei het bedrijf dat betaalde abonnees van ChatGPT in de Verenigde Staten en verschillende andere landen Sora kunnen gebruiken om hun eigen video’s te genereren. In tegenstelling tot de videogenererende modellen van andere technologiebedrijven, die previews blijven of uitsluitend beschikbaar zijn via zakelijke cloudplatforms, is Sora het eerste videogenererende product dat een groot technologiebedrijf rechtstreeks in de handen van gebruikers plaatst. Chatbots en beeldgeneratoren zoals DALL-E van OpenAI hebben het voor iedereen al moeiteloos gemaakt om gedetailleerde inhoud in slechts een paar seconden te creëren en te delen, waardoor hele industrieën worden bedreigd en diepgaande veranderingen in de online communicatie worden bespoedigd. Het tijdperk van video-genererende AI-modellen zal deze verschuivingen alleen maar diepgaander, sneller en bizarder maken.
Het sleutelwoord van OpenAI vanmiddag was product. Het bedrijf factureert Sora niet als een doorbraak in onderzoek, maar als een consumentenervaring – onderdeel van de voortdurende commerciële hapering van het bedrijf. Bij de oprichting, in 2015, was OpenAI een non-profitorganisatie met een missie om digitale intelligentie op te bouwen “ten behoeve van de mensheid als geheel, niet beperkt door de noodzaak om financieel rendement te genereren.” Tegenwoordig pompt het producten en zakelijke deals uit, net als elk ander technologiebedrijf dat op winst jaagt. OpenAI heeft in 2019 een tak met winstoogmerk toegevoegd, en vanaf september is dat het geval naar verluidt overwegende het volledig intrekken van de controle over het non-profitbestuur. Sora’s marketing is zelfs een verandering ten opzichte van februari, toen OpenAI het videogenereringsmodel presenteerde als een stap in de richting van de verheven missie van het bedrijf om technologie te creëren die intelligenter is dan mensen. Bill Peebles, een van Sora’s hoofdonderzoekers, vertelde me in mei dat video ‚een paar wegen naar AGI‘ of kunstmatige algemene intelligentie mogelijk zou maken, door de programma’s van het bedrijf toe te staan natuurkunde en zelfs menselijke gedachten te simuleren. Om een video van een voetbalwedstrijd te genereren, moet Sora mogelijk zowel de aerodynamica als de psychologie van de spelers modelleren.
De aankondiging van vandaag werd voorafgegaan door een beoordeling door Marques Brownlee, een YouTuber die bekend staat om zijn recensies van gadgets zoals iPhones en virtual reality-headsets. Altman droeg een hoodie met het woord erop Sora. Altman en het productteam van Sora spraken ruim 17 minuten; Peebles en een andere onderzoeker spraken gedurende één minuut en 45 seconden en prezen vooral hoe het bedrijf een ‘turbo’-versie van Sora lanceert die ‘veel sneller en goedkoper’ is om een ‘nieuwe productervaring’ te lanceren.
De Sora-release komt op de derde van “12 Days of OpenAI”, een periode waarin elke dag een nieuw product wordt uitgebracht of gedemonstreerd aan gebruikers. Wat het bedrijf heeft aangekondigd lijkt meer op een product dan op een doorbraak in de computerwetenschappen: een gestroomlijnde interface voor het maken en bewerken van video’s, met functies als ‚Remix‘, ‚Loop‘ en ‚Blend‘. Tot nu toe zijn veel van Sora’s resultaten indrukwekkend en zelfs wonderbaarlijk geweest. Het bedrijf heeft niet zozeer een nieuwe, intelligentere bot gebouwd als wel een interface in de stijl van iMovie en Premiere Pro.
Er zijn al video’s die OpenAI-medewerkers en early-access-gebruikers met Sora hebben gemaakt druppelen op sociale media, en een stortvloed van gebruikers over de hele wereld zal dat doen volgen. Al meer dan twee jaar hebben goedkope en gebruiksvriendelijke generatieve AI-modellen van iedereen een potentiële illustrator gemaakt; binnenkort kan iedereen ook animator worden. Dat vormt een duidelijke bedreiging voor menselijke illustratoren en animators, van wie velen al lang de noodklok luiden tegen het feit dat generatieve AI hun broodwinning wegneemt. Sora en soortgelijke programma’s wekken ook het schrikbeeld van desinformatiecampagnes op. (Sora-video’s worden geleverd met een visueel watermerk, maar met het hoogste abonnementsniveau van OpenAI, dat $ 200 per maand kost, kunnen klanten clips maken zonder watermerk.)
Maar banenverlies en desinformatie zijn wellicht niet de meest directe of significante gevolgen van de Derde Dag van OpenAI. Beide gebeurden zonder Sora, ook al versnelt het programma elk probleem: productiestudio’s waren al aan het experimenteren met zakelijke AI-producten om video’s te genereren, zoals een recent Coca-Cola-vakantiereclame. En goedkope, minder technische methoden voor het creëren en verspreiden van valse informatie zijn buitengewoon succesvol geweest op zichzelf.
Wat de massale acceptatie van video-genererende AI-producten op betekenisvolle wijze zou kunnen veranderen, is de manier waarop mensen zich online uiten. Het afgelopen jaar hebben door AI gegenereerde memes, tekenfilms, karikaturen en andere afbeeldingen, ook wel ‘slop’ genoemd, het internet verzadigd. Deze inhoud, waarvan een groot deel duidelijk door AI is gegenereerd en niet bedoeld is om te misleiden – een medium voor ruwe zelfexpressie, en niet voor verfijnde uitvluchten – kan de basis van de technologie zijn geweest. grootste impact over de presidentsverkiezingen van 2024. Dat iedereen zulke beelden kan genereren, biedt een manier om onmiddellijk beginnende gevoelens over een beginnende wereld tot uitdrukking te brengen door middel van een onmiddellijk verteerbaar beeld. Zoals mijn collega Charlie Warzel heeft gedaan geschrevenis het de bedoeling dat dergelijke inhoud “vluchtig wordt geconsumeerd, en met weinig of geen nadenken buiten de initiële reactie van het limbisch systeem.”
Een stortvloed aan door AI gegenereerde video’s zou nog krachtigere manieren kunnen bieden om verwarring, beladen gevoelens of overtuigende propaganda visueel over te brengen – misschien een veel levensechtere versie van de recente, door AI gegenereerde video’s van lage kwaliteit. video van Donald Trump en Jill Biden in een vuistgevecht bijvoorbeeld. Sora zou TikTok en soortgelijke korte videoplatforms kunnen overnemen, net zoals AI-beeldgenererende modellen Facebook hebben vervormd en de manier hebben veranderd waarop mensen op X hun steun betuigen aan politieke kandidaten.
Sora’s overname van het internet is niet gegarandeerd. In mei vergeleek Tim Brooks, een andere Sora-onderzoeker die sindsdien bij Google is gekomen, de huidige status van het programma met GPT-1, de vroegste versie van de programma’s die ten grondslag liggen aan ChatGPT, die zich momenteel in de vierde generatie bevinden. OpenAI herhaalde de analogie vandaag. Die vergelijking is verbroken omdat het bedrijf steeds meer winstgedreven is geworden: GPT-1 was een zeer voorlopig onderzoek, een concept vóór een proof of concept, en vier jaar verwijderd van de release van ChatGPT. Sora is misschien net zo onontwikkeld als een middel voor AGI, maar het is een volwaardig product geworden bijna tien maanden nadat OpenAI het model plaagde. Dergelijke technologie in een vroeg stadium betekent mogelijk geen significante vooruitgang in de richting van het genezen van kanker, het oplossen van de klimaatcrisis, of andere manieren waarop de start-up heeft beweerd dat AI de mensheid als geheel ten goede zou kunnen komen. Maar het zou wel eens alles kunnen zijn wat OpenAI nodig heeft om zijn bedrijfsresultaten te verbeteren.