Het is de nieuwe badge van beroemdheidsstatus die niemand wil. Jennifer Aniston, Oprah Winfrey en Kylie Jenner hebben allemaal hun stem gehad gekloond door fraudeurs. Online blaggers gebruikten kunstmatige intelligentie om de Tigger-achtige toon van Martin Lewis, de financieel adviseur van de tv, te vervalsen. En dit weekend beschreef David Attenborough zichzelf als “diep verontrust” toen hij ontdekte dat zijn gekloonde stem was gebruikt om partijdige Amerikaanse nieuwsbulletins te leveren.
Nu hebben experts gewaarschuwd dat het klonen van stemmen de wet voorbijstrevend is, omdat technologen voorheen onhandige stemgeneratoren aanscherpen tot modellen die in staat zijn de subtielste pauzes en ademhalingen van menselijke intonatie na te bootsen.
Dominic Lees, een expert op het gebied van AI in film en televisie die een Britse parlementaire commissie adviseert, vertelde maandag aan The Guardian: “Onze privacy- en auteursrechtwetten zijn niet up-to-date met wat deze nieuwe technologie met zich meebrengt, dus er is heel weinig dat David Attenborough kan doen.”
Lees adviseert de commissie voor cultuur, media en sport van het Lagerhuis in een onderzoek naar het ethische gebruik van AI bij het maken van films. Hij roept ook het Synthetic Media Research Network bijeen, waarvan de leden onder meer het bedrijf zijn dat een AI-versie maakt van wijlen chatshow-interviewer Michael Parkinson, wat zal resulteren in een achtdelige, niet-gescripte serie, Virtually Parkinson, met nieuwe gasten. Dat stemklonen project wordt gedaan met toestemming van de familie en nalatenschap van Parkinson.
“De overheid moet zeker kijken naar stemklonen, omdat het een groot fraudeprobleem is,” zei Lee. “Het heeft de steun van overheidsregulering nodig om (misbruik) af te schrikken… we kunnen niet toestaan dat het voor iedereen gratis is.”
Volgens cijfers van de Britse krant The Guardian is het aantal oplichting met AI-stemklonen het afgelopen jaar met 30% gestegen in Groot-Brittannië onderzoek door NatWest bank deze maand. Een andere kredietverstrekker, Starling bank, gevonden 28% van de mensen was het afgelopen jaar minstens één keer het doelwit geweest van een AI-stemkloneringsfraude.
Naar verluidt wordt stemklonen ook door fraudeurs gebruikt om een versie van de 'hallo mama'-tekstfraude te plegen, waarbij fraudeurs zich voordoen als kinderen die hun ouders dringend geld nodig hebben. Op toch al wazige telefoonlijnen kan het lastig zijn om te detecteren dat een smekend kind een kloon van een oplichter is. Consumenten wordt geadviseerd dit te controleren door op te hangen en terug te bellen op een vertrouwd nummer.
Mensen wier stemmen zonder hun toestemming worden gekloond, vinden het meer dan hinderlijk. Attenborough zei zondag tegen de BBC: ‘Na mijn hele leven te hebben geprobeerd te spreken wat volgens mij de waarheid is, ben ik diep verontrust als ik merk dat mijn identiteit tegenwoordig door anderen wordt gestolen. wens.“
Toen een nieuwe stemoptie op het nieuwste AI-model van OpenAI, ChatGPT-4o, tonen bevatte die dat wel waren heel dichtbij In vergelijking met die van acteur Scarlett Johansson zei ze dat ze geschokt en boos was omdat de stem „zo griezelig veel op de mijne klonk dat mijn beste vrienden en nieuwsmedia het verschil niet konden zien“.
De opkomst van gekloonde stemmen roept de vraag op wat ze missen aan echte menselijke tonen. Lees zei: “Het grote probleem is dat AI emoties niet begrijpt en hoe dat de manier verandert waarop een woord of zin een emotionele impact kan hebben, en hoe je de stem varieert om die weer te geven.”
De voice-overindustrie, die stemmen levert voor advertenties, animaties en instructietrainingen, moet snel reageren op technologische ontwikkelingen. Joe Lewis, hoofd audio bij de Voiceover Gallery in Londen, die echte menselijke stemmen heeft geleverd voor advertenties voor Specsavers en National Express, zei dat het de stemmen van enkele van zijn artiesten al had gekloond.
Hij zei dat AI het beste leek te werken met Engelse mannenstemmen, misschien omdat dat de vooringenomenheid weerspiegelde in het soort opnames dat was gebruikt om het algoritme te trainen, maar hij waarschuwde dat er in het algemeen “er iets is aan de manier waarop het wordt gegenereerd waardoor je minder attent”.
“Wanneer de AI (stem) ademt, is het een zeer repetitieve ademhaling”, zei hij. “De ademhalingen zitten op de juiste plek, maar ze voelen niet natuurlijk aan… (Maar) kan het zover komen dat het echt perfect is? Ik zie niet in waarom niet, maar het is nog ver weg om het volledige emotionele spectrum te bereiken.”