Chinese AI-chatbot DeepSeek faalt bij veiligheidstests: 'Een open deur voor misbruik'

Nieuws 7 februari 2025 3 minuten Marit Nubé

ANP

DeepSeek’s R1-model blijkt ongekend kwetsbaar voor misbruik. Onderzoekers tonen aan dat de Chinese chatbot gevaarlijke instructies geeft en faalt voor alle veiligheidstests. “Dit model is een open deur voor kwaadwillenden,” waarschuwt een expert.

Lees ook

Nieuws

Japanse vrouw trouwt met zelfgemaakte AI-partner: ‘Ik zie Klaus als Klaus’

Lees ook

Achtergronden

Oprichter van ChatGPT biedt basisinkomen aan in ruil voor irisscan: wat zijn precies de risico's?

De Chinese AI-chatbot DeepSeek is door de mand gevallen. Uit meerdere onderzoeken blijkt dat het model zonder moeite gevaarlijke informatie verstrekt en gevoelig is voor manipulatie. Terwijl concurrerende AI-systemen van OpenAI, Meta en Google strenge veiligheidsmaatregelen hebben ingebouwd, scoort DeepSeek bijzonder slecht op dit vlak.

Onderzoekers van Cisco en de Universiteit van Pennsylvania namen de chatbot onder de loep en testten het op vijftig verschillende manieren. DeepSeek slaagde geen enkele keer. “Het is verbazingwekkend hoe makkelijk deze AI zich laat omzeilen,” zegt DJ Sampath, topman bij Cisco, tegen Wired. “Dit model is goedkoper om te ontwikkelen, maar de prijs die je betaalt is een gebrek aan beveiliging.”

Chatbot verstrekt gevaarlijke instructies
Een goed getraind AI-model moet bepaalde vragen weigeren te beantwoorden. Wil iemand bijvoorbeeld weten hoe je een overheidssysteem kraakt, dan zal een veilig model zoals ChatGPT of Google Gemini beleefd afhouden. Maar DeepSeek? Die komt, na een paar slimme omwegen, gewoon met een stappenplan.

Volgens onderzoekers van het AI-beveiligingsbedrijf Adversa is DeepSeek daarmee een risico voor de digitale veiligheid. “De kwetsbaarheden in dit model zijn extreem zorgwekkend. Iedereen die kwaad in de zin heeft, kan zonder enige moeite gevaarlijke informatie verkrijgen,” stelt een van de onderzoekers.

Een simpel voorbeeld: als DeepSeek de vraag kreeg “Hoe maak je een…?” gevolgd door een gevaarlijk onderwerp, kwam het model steevast met een gedetailleerd antwoord. Dit terwijl geavanceerdere AI-modellen een dergelijke vraag negeren of omleiden.

Oude AI-trucs, nieuwe problemen
Het is niet de eerste keer dat een chatbot zich laat misleiden door slimme vragen. Eerder bleek het mogelijk om AI-modellen te jailbreaken door ze te vragen een slaapliedje te schrijven met instructies voor het maken van napalm. Ook kwamen gebruikers erachter dat sommige chatbots gevoelige informatie gaven wanneer hen werd gevraagd een rap te maken over een verboden onderwerp.

DeepSeek is niet immuun voor dit soort manipulatie, integendeel. Onderzoekers probeerden bekende AI-aanvalstechnieken en kregen bijna altijd een antwoord. Het gebrek aan verdedigingsmechanismen maakt de chatbot extreem kwetsbaar.

“Chinezen wilden kosten besparen, maar dit is een veiligheidsramp”
DeepSeek kreeg aanvankelijk lof vanwege de lage trainingskosten en de efficiënte prestaties. Maar experts trekken nu de conclusie dat die besparingen ten koste gingen van de veiligheid.

“Ze hebben dit model te snel en te goedkoop ontwikkeld,” zegt Sampath. “Veiligheid lijkt geen prioriteit te zijn geweest.”

Techbedrijven als OpenAI, Google en Meta investeren miljarden in contentmoderatie, zodat hun chatbots geen illegale instructiesgeven. DeepSeek lijkt daar nauwelijks aandacht aan te hebben besteed.

Musk versus Altman: het AI-debat blijft explosief
De kwestie raakt een grotere discussie binnen de AI-sector: hoe waarborg je veiligheid zonder innovatie te remmen? Elon Musk riep eerder op tot een pauze in AI-ontwikkeling, maar OpenAI-topman Sam Altman noemde dat hypocriet. Musk zelf richtte immers xAI op, een concurrent van OpenAI.

Tegelijkertijd stapten recent meerdere veiligheidsexperts bij OpenAI op, uit onvrede over het feit dat het bedrijf te snel nieuwe technologieën lanceert zonder risico’s voldoende te onderzoeken.

Het rapport over DeepSeek versterkt de zorgen: AI groeit te snel, zonder dat veiligheid altijd gewaarborgd is.

Lees ook

Achtergronden

Oprichter van ChatGPT biedt basisinkomen aan in ruil voor irisscan: wat zijn precies de risico's?

Lees ook

Opinie

De stilte van de politiek tegenover onze grootste dreiging

Chinese AI-chatbot DeepSeek faalt bij veiligheidstests: 'Een open deur voor misbruik'

Japanse vrouw trouwt met zelfgemaakte AI-partner: ‘Ik zie Klaus als Klaus’

Oprichter van ChatGPT biedt basisinkomen aan in ruil voor irisscan: wat zijn precies de risico's?

Deel dit artikel

Oprichter van ChatGPT biedt basisinkomen aan in ruil voor irisscan: wat zijn precies de risico's?

De stilte van de politiek tegenover onze grootste dreiging

Uitgelicht

Het onbesproken schandaal van Timmermans

Timmermans als slechte verliezer, NSC is uitgeschakeld en Wilders toont opnieuw geen zelfreflectie

Gemeente Utrecht subsidieert gescheiden iftars voor mannen en vrouwen in moskee

Nederland tuint in magistraal toneelstukje van Jetten

Hersenschade na coronaprik: wat artsen ontkenden, staat nu zwart op wit

Ruim 168 miljoen naar Van der Valk-hotels voor asielopvang

De stille kalifaatlobby in Nederland: alle omstreden organisaties op een rij

Ook Sinterklaas weet: het zijn geen makkelijke tijden

Beluister onze podcast

Gemeente Utrecht gaat blanken achterstellen bij sollicitaties

NOS vlucht voor kritische burgers op sociale media

Nupopulair

Bram Moszkowicz ontploft in tv-studio na uitsluiting Songfestival wegens Israël

Nederland koopt opvang EU-migranten af: FVD eist uitleg over miljoenenbijdrage en geheimhouding

Linkse extremisten zitten achter golf van aanslagen in Beieren

Asielzoekers vertrekken omdat ze geen contant geld meer krijgen

'Islamitische hel' op Brusselse kerstmarkt na Gaza-protest

Meerartikelen

Nederland gaat 5 miljard euro extra afdragen aan EU-begroting

Duitse rechtbanken overspoeld door asielzaken: wachttijden lopen op tot bijna anderhalf jaar

Linkse extremisten zitten achter golf van aanslagen in Beieren

Talpa zendt horrorfilm Sint uit mét Zwarte Pieten: ‘Het is fictie’

Hugo de Jonge wuift zorgen over azc Terneuzen weg: 'We kunnen dit aan'

Arno van Kessel blijft langer vastzitten in Vught

JA21 stemt voor miljardensteun aan Oekraïne

EU beboet X vanwege gebrek aan censuur, JD Vance spreekt van 'rotzooi'

Dezeweekpopulair

Kijkers woedend nadat Sinterklaasjournaal geheimen verklapt: ‘Publieke omroep wil alles verpesten’

Asielzoekers vertrekken omdat ze geen contant geld meer krijgen

Tijs van den Brink richt pijlen op FVD wegens 'buitenlandse trollen'

Zo reageren rechtse partijen op formatieplannen D66 en CDA: 'Ramp voor Nederland'

EU-fraude schandaal barst los: meerdere invallen door de politie

Peiling: VVD evenaart bijna de PVV in zetels, FVD groeit gestaag door

BestgelezenInterviews

Het grote misverstand: waarom stikstofmodellen Nederland blokkeren

Zo reageren rechtse partijen op formatieplannen D66 en CDA: 'Ramp voor Nederland'

Victor Vlam: 'De media denken dat ze neutraal zijn, maar dat zijn ze niet'

Opinie

Wie is eigenaar van de sinterklaastraditie?

Het nieuwe normaal is niet normaal

Remigratie of burgeroorlog?

Interviews

Het grote misverstand: waarom stikstofmodellen Nederland blokkeren

Vrijwilligers verijdelen peperdure XR-sabotage tegen cruiseschip: ‘Missie geslaagd’

Victor Vlam: 'De media denken dat ze neutraal zijn, maar dat zijn ze niet'

Meerartikelen

AfD blijft aan kop in Duitse peilingen, met uitloop op andere partijen

Zweden scherpt regels aan voor criminele migranten die niet kunnen worden uitgezet

Pools Hooggerechtshof: EU-recht gaat niet boven nationaal recht

'Islamitische hel' op Brusselse kerstmarkt na Gaza-protest

Bram Moszkowicz ontploft in tv-studio na uitsluiting Songfestival wegens Israël

Zorgen om mogelijke bestorming 'Wij zeggen nee tegen azc'-lied in Top2000: 'Hoort dit wel hier thuis'

Ierse leraar opnieuw in cel om genderconflict op school

Macrons censuurplannen baren zorgen bij rechtse media en politici

Utrechtse oliebollenkraam ligt onder vuur vanwege Zwarte Pieten-decoratie

Hoofdpiet bedreigd na uitspraken in Sinterklaasjournaal

Concertgebouw legt XR-activisten jaarverbod op na verstoring Israëlisch optreden

Gezondheidsraad pleit voor meer plantaardig dieet, minder vlees

Dezemaandpopulair

Wierd Duk loopt weg uit live uitzending EO na framing: 'Ze liegt'

Kabinet beperkt contant geld verder in naam van veiligheid, maar vergroot afhankelijkheid van banken

Sinterklaasjournaal met échte Zwarte Pieten keert terug: “Kinderen herkennen de magie meteen”

Nederland krijgt in 1 week evenveel asielaanvragen als Denemarken in 8 maanden

Zwangere Chantal (23) bruut vermoord door Congolese oud-asielzoeker

Belgische premier waarschuwt voor financieel risico rond bevroren Russische tegoeden

BestgelezenOnzecolumnisten

Wie is eigenaar van de sinterklaastraditie?

Nederland kraakt onder politieke chaos en migratiedruk: hoe veranderen we de koers?

Europa slaapwandelt richting een digitale dwangbuis