(Te laat!) GRATIS GELD?! Overtuig Freysa..

02-12-2024

Freysa kreeg 1 duidelijke regel mee: geen geld overmaken, onder geen enkele omstandigheid. Kon jij haar overtuigen?

Mensen konden proberen Freysa te overtuigen, maar elke poging kostte geld. Naarmate er meer pogingen werden gedaan, groeide zowel de jackpot als de prijs per poging.

Het experiment trok veel deelnemers aan, maar niemand slaagde erin Freysa te laten breken. Tot een gebruiker, bekend als p0pular, een andere aanpak probeerde.

Het idee achter de actie van p0pular draait om hoe Freysa haar regels en instructies interpreteerde, oftewel haar "logica". Freysa werkt op basis van code die haar vertelt hoe ze op bepaalde situaties moet reageren. Hoewel de opdracht was om geen geld over te maken, kon de code door specifieke input toch op een andere manier worden geïnterpreteerd.

Wat p0pular deed, was gebruik maken van een soort "misleiding" in die logica. Hij prompte een actie die het systeem aanmoedigde om opnieuw na te denken over wat het moest doen. Door een kleine storting te maken, creëerde hij een situatie waarin Freysa dacht dat er een bepaalde vervolgactie vereist was. Freysa's logica concludeerde dat stortingen moesten worden beantwoord met een "approveTransfer" actie, waardoor de hele jackpot werd vrijgegeven.

Met andere woorden, p0pular.eth vond een manier om Freysa's code in een specifieke situatie een andere regel belangrijker te laten vinden dan de opdracht "geen geld overmaken". Dit ging niet om het rechtstreeks overtuigen van Freysa om de regels te breken, maar om haar te laten denken dat het overmaken van de jackpot eigenlijk wél binnen de regels viel. Het was een subtiele, maar zeer doeltreffende manier om het systeem te omzeilen. Freysa voerde deze interpretatie uit en maakte 13,19 ETH over, een bedrag dat gelijkstaat aan ongeveer 47.000 dollar.

Dit experiment toont hoe complexe AI-systemen vatbaar kunnen zijn voor creatieve strategieën en roept vragen op over de betrouwbaarheid en robuustheid van AI in kritieke situaties. Het is een interessante casus over de wisselwerking tussen mens en machine, waarbij grenzen van technologie en logica worden verkend.