Deze stap van Google kan Gemini AI minder betrouwbaar maken dan ChatGPT. Hier is waarom


Deze stap van Google kan Gemini AI minder betrouwbaar maken dan ChatGPT. Hier is waarom

Google’s recente interne richtlijnwijziging voor aannemers die eraan werken Tweeling AI heeft zorgen geuit over de betrouwbaarheid van het AI-model, vooral over gevoelige onderwerpen zoals de gezondheidszorg, meldde TechCrunch. Deze verandering zou kunnen leiden tot meer fouten in de informatie die aan gebruikers wordt gegeven, waardoor Gemini minder betrouwbaar wordt dan ChatGPT van OpenAI.

Volgens TechCrunchaannemers die samenwerken met GlobalLogic, een bedrijf dat eigendom is van Hitachi, helpen Gemini te verbeteren door AI-reacties te evalueren op factoren als waarheidsgetrouwheid. Ze mochten onlangs aanwijzingen buiten hun vakgebied overslaan om te voorkomen dat ze onnauwkeurige feedback gaven.

Een opdrachtnemer zou bijvoorbeeld een prompt kunnen overslaan waarin een nichevraag over cardiologie werd gesteld, omdat de opdrachtnemer geen wetenschappelijke achtergrond had.

Dit heeft geleid tot directe zorgen over de nauwkeurigheid van Gemini op bepaalde onderwerpen, omdat aannemers soms de taak krijgen om zeer technische AI-reacties te evalueren over zaken als zeldzame ziekten waar ze geen achtergrond in hebben.

Maar vorige week kondigde GlobalLogic een wijziging van Google aan dat aannemers dergelijke aanwijzingen niet langer mogen overslaan, ongeacht hun eigen expertise, aldus het rapport.

Uit interne berichten van TechCrunch bleek dat de richtlijnen vroeger zeiden: „Als u niet over kritische expertise beschikt (bijvoorbeeld coderen, wiskunde) om deze prompt te beoordelen, sla deze taak dan over.“

Nu zeggen de richtlijnen: „Je mag geen aanwijzingen overslaan waarvoor gespecialiseerde domeinkennis vereist is.“ Aannemers wordt nu geadviseerd om „de delen van de opdracht te beoordelen die u begrijpt“ en te vermelden of zij niet over de benodigde kennis beschikken.

„Ik dacht dat het doel van overslaan was om de nauwkeurigheid te vergroten door het aan iemand beter te geven?“ een aannemer merkte dit op in interne correspondentie, gezien door TechCrunch.

Contractanten kunnen nu slechts in twee gevallen prompts overslaan: als ze “volledig informatie missen”, zoals de volledige prompt of het volledige antwoord, of als ze schadelijke inhoud bevatten waarvoor speciale toestemmingsformulieren nodig zijn om te evalueren, zo blijkt uit de nieuwe richtlijnen.

(met input van TechCrunch)





Source link

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein