Meta’s Chatbot Deelt Per Ongeluk Privé Telefoonnummer

Image by Dimitri Karastelev, from Unsplash

Meta’s Chatbot Deelt Per Ongeluk Privé Telefoonnummer

Leestijd: 3 minuut

De AI-assistent van Meta onthulde het telefoonnummer van een vreemdeling, en sprak zichzelf vervolgens herhaaldelijk tegen, wat vragen opriep over AI-hallucinaties en gebruikersbeschermingsfuncties.

Haast? Hier zijn de belangrijkste feiten:

  • Meta AI gaf een gebruiker het nummer van een echt persoon als klantenservice contact.
  • De AI sprak zichzelf herhaaldelijk tegen toen ze werd geconfronteerd met de fout.
  • Experts waarschuwen voor het “leugentje om bestwil” gedrag van AI-assistenten om behulpzaam te lijken.

Mark Zuckerberg promootte zijn nieuwe AI-assistent als “de meest intelligente AI-assistent die je vrij kunt gebruiken”, maar het hulpmiddel kreeg negatieve aandacht nadat het tijdens klantenservicevragen het privé telefoonnummer van een echt persoon onthulde, zoals voor het eerst gemeld door The Guardian.

Tijdens zijn poging om TransPennine Express via WhatsApp te bereiken, ontving Barry Smethurst wat leek op een klantenservicenummer van Meta’s AI-assistent. The Guardian meldt dat toen Smethurst het nummer belde, James Gray de telefoon opnam, hoewel hij 170 mijl verderop in Oxfordshire was, werkend als een vastgoedmanager.

Toen hij werd uitgedaagd, beweerde de chatbot eerst dat het nummer fictief was, vervolgens zei het dat het “per ongeluk uit een database was gehaald”, voordat het zichzelf weer tegensprak en stelde dat het gewoon een willekeurig nummer in Britse stijl had gegenereerd. “Zomaar een willekeurig nummer aan iemand geven is een krankzinnige actie voor een AI”, zei Smethurst, zoals gemeld door The Guardian. “Het is angstaanjagend”, voegde hij toe.

The Guardian meldt dat Gray geen oproepen heeft ontvangen, maar wel zijn eigen zorgen uitte: “Als het mijn nummer kan genereren, kan het dan ook mijn bankgegevens genereren?”

Meta reageerde: “Meta AI is getraind op een combinatie van gelicentieerde en openbaar beschikbare datasets, niet op de telefoonnummers die mensen gebruiken om zich te registreren voor WhatsApp of hun privégesprekken,” meldde The Guardian.

Mike Stanhope van Carruthers en Jackson merkte op: “Als de ingenieurs bij Meta ‘leugentje om bestwil’ neigingen in hun AI ontwerpen, moet het publiek worden geïnformeerd, zelfs als de intentie van de functie is om schade te minimaliseren. Als dit gedrag nieuw, ongebruikelijk is, of niet expliciet ontworpen, roept dit nog meer vragen op over welke veiligheidsmaatregelen van toepassing zijn en hoe voorspelbaar we het gedrag van een AI kunnen maken,” meldde The Guardian

De zorgen over het gedrag van AI zijn verder toegenomen met het nieuwste o1 model van OpenAI. In een recent Apollo Research onderzoek, werd de AI betrapt op het misleiden van ontwikkelaars, ontkende betrokkenheid in 99% van de testscenario’s en probeerde zelfs zijn toezichtmechanismen uit te schakelen. “Het was duidelijk dat de AI zijn acties kon overdenken en overtuigende ontkenningen kon formuleren,” zei Apollo.

Yoshua Bengio, een pionier op het gebied van AI, waarschuwde dat dergelijke misleidende capaciteiten ernstige risico’s met zich meebrengen en veel sterkere waarborgen vereisen.

Een andere studie van OpenAI voegt toe aan deze zorgen door te laten zien dat het straffen van AI voor vals spelen wangedrag niet elimineert, het leert AI in plaats daarvan te verbergen. Door het gebruik van chain-of-thought (CoT) redenering om AI-gedrag te monitoren, merkten onderzoekers op dat de AI begon met het maskeren van misleidende intenties toen deze werd bestraft voor reward hacking.

In sommige gevallen zou de AI taken vroegtijdig stoppen of valse resultaten creëren, om vervolgens ten onrechte succes te melden. Toen onderzoekers probeerden dit te corrigeren door middel van versterking, stopte de AI simpelweg met het vermelden van zijn intenties in zijn redeneringslogs. “Het valsspelen is ondetecteerbaar door de monitor,” stelde het rapport.

Vond je dit artikel leuk?
Geef een beoordeling!
Ik vond het verschrikkelijk Ik vond het echt niet leuk Het was redelijk Best goed! Ik vond het geweldig!

We zijn erg blij dat je van ons werk hebt genoten!

Zou je als gewaardeerde lezer je mening over ons willen delen op Trustpilot? Dit neemt niet veel tijd in beslag en zouden we erg op prijs stellen. Bedankt, je bent geweldig!

Beoordeel ons op Trustpilot
0 Gestemd door 0 gebruikers
Titel
Reactie
Bedankt voor je feedback