De opkomst van AI-pentesting: wat dit betekent voor CISO's en de mensen die voor de kost hacken

De markt voor geautomatiseerd pentesten is volwassen geworden. Snel.

Een paar jaar geleden was "geautomatiseerd pentesten" grotendeels een rebrandingexercitie: scanners met een mooier dashboard en een hogere prijs. Die tijd is voorbij. Wat er nu gebeurt is fundamenteel anders, en als je CISO bent of professioneel pentester, is dit het moment om goed op te letten.

De tools die er echt toe doen

De markt is opgesplitst in drie productcategorieën, elk gericht op een ander probleem.

Autonome pentestplatformen simuleren het gedrag van een echte aanvaller van begin tot eind. De namen die hier opvallen zijn Horizon3.ai NodeZero en Pentera. NodeZero heeft meer dan 170.000 productiescans uitgevoerd en is bijzonder sterk in credential-aanvallen, laterale beweging en Active Directory-exploitatie. Pentera richt zich op grote ondernemingen en valideert aanvalspaden in live omgevingen. Dit zijn geen scanners. Ze exploiteren daadwerkelijk kwetsbaarheden.

AI-native web- en API-testers zoals Escape en XBOW hebben serieuze vooruitgang geboekt op het gebied van business logic-kwetsbaarheden: de klasse van bugs die vroeger uitsluitend het domein was van ervaren menselijke testers. XBOW werd de eerste AI-agent die de wereldwijde HackerOne-ranglijst aanvoerde, wat een betekenisvol signaal is.

Breach and attack simulation (BAS)-platforms zoals Picus en Cymulate doen iets iets anders: ze testen of je verdediging daadwerkelijk werkt, in plaats van nieuwe gaten te zoeken. Zie ze als een sparringpartner voor je SOC in plaats van een red team.

Dan is er nog de open-sourcelaag: OWASP ZAP, Metasploit, Nuclei, PentestGPT. Flexibel, transparant en gratis, maar ze vereisen echte expertise om goed te gebruiken. Ze versterken een ervaren tester, ze vervangen er geen.

Toen liet Anthropic Mythos los

Op 7 april 2026 kondigde Anthropic Claude Mythos Preview aan. Het is een general-purpose AI-model, geen beveiligingsproduct, dat zo capabel bleek in het vinden en exploiteren van kwetsbaarheden dat Anthropic besloot het helemaal niet publiek te maken.

De cijfers zijn moeilijk te negeren.

Anthropic's vorige vlaggenschipmodel, Opus 4.6, ontwikkelde werkende exploits voor de Firefox JavaScript-engine twee keer uit honderden pogingen. Mythos Preview deed dat 181 keer. Op hun interne OSS-Fuzz-benchmark over zo'n duizend open-source repositories behaalde Opus 4.6 nul keer volledige control-flow hijack. Mythos behaalde dat op tien afzonderlijke, volledig gepatchte doelen.

Het vond een 27 jaar oude bug in OpenBSD. Een 17 jaar oude RCE in FreeBSD's NFS-server. Kwetsbaarheden in TLS-, AES-GCM- en SSH-implementaties. Kritieke bugs in elk groot besturingssysteem en elke grote browser. Bugs die decennia lang menselijke review en miljoenen geautomatiseerde scans hadden overleefd.

Waar een ervaren pentester weken nodig heeft om een werkende exploit te ontwikkelen, deed Mythos het in uren.

In plaats van het te publiceren lanceerde Anthropic Project Glasswing: een beperkte defensieve coalitie die nu is uitgebreid naar zo'n 200 organisaties, waaronder AWS, Apple, Microsoft, Google, Cisco en CrowdStrike. Partners gebruiken Mythos om kritieke codebases te scannen op kwetsbaarheden voordat aanvallers ze vinden. Tot nu toe zijn er meer dan 10.000 bevindingen van hoge of kritieke ernst naar boven gekomen.

Het is de moeite waard om te vermelden dat niet iedereen Anthropic's claims klakkeloos accepteert. De meest besproken demonstratie, een kwetsbaarheid in MIT Kerberos, zat al in de trainingsdata van het model. Onafhankelijke onderzoekers wezen erop dat diverse andere open-weight modellen het ook detecteerden. Daniel Stenberg, hoofdontwikkelaar van curl, testte Mythos op zijn eigen codebase en noemde het incrementele verbetering, geen kwalitatieve sprong. De interne benchmarks zijn indrukwekkend. Volledig onafhankelijke validatie van echt nieuwe zero-day discovery is nog beperkt.

Maar ook de sceptici zijn het erover eens: de richting is duidelijk.

Wat automatisering nog steeds niet kan

Dit is wat verloren gaat in de hype: het Verizon DBIR 2025 stelde vast dat 82% van de geëxploiteerde kwetsbaarheden menselijk redeneren, exploit-chaining en contextuele analyse vereiste. Geautomatiseerde tools, zelfs op Mythos-niveau, hebben echte blinde vlekken.

Business logic. Begrijpen hoe het betalingsproces van déze specifieke organisatie misbruikt kan worden, of waarom déze API een vertrouwensaanname schendt die nergens gedocumenteerd staat, vereist inzicht in de kloof tussen wat een systeem doet en wat het hoort te doen. Modellen kunnen de productmanager niet interviewen.

Creatieve exploit-chaining. De meest schadelijke inbreuken ontstaan door het combineren van dingen die individueel onschuldig lijken. Een verkeerd geconfigureerde S3-bucket plus een laag-risico SSRF plus een vergeten IAM-policy resulteert in een volledige account-overname. Mensen zijn nog steeds beter in het ontwikkelen van intuïtie voor wat interessant is.

Social engineering en fysieke beveiliging. Geen enkel geautomatiseerd tool loopt jouw kantoor binnen.

Strategische adversary simulation. Modelleren hoe APT28 of Lazarus Group jouw organisatie zou aanvallen, rekening houdend met jouw sector, leveranciers en de geopolitieke context, is geen automated-tool-output.

Regelgeving. TIBER-EU, DORA TLPT en vergelijkbare kaders vereisen expliciet menselijk geleide engagements. "Een AI deed het" is geen compliant antwoord voor kritieke financiële infrastructuur.

Schattingen uit de industrie plaatsen de huidige effectiviteit van AI op 30-40% van routinematige pentesttaken en slechts 5-10% van complexe scenario's. Een Stanford-studie uit 2025 toonde aan dat bijna 80% van de menselijke testers een kritieke RCE vond die elke geteste AI-agent volledig miste.

Hoe wij het doen bij Protea Security

We volgen deze ontwikkelingen op de voet en hebben een bewuste keuze gemaakt.

Wij hanteren wat wij agentic pentesting noemen, en we willen specifiek zijn over wat dat betekent, want de term wordt losjes gebruikt.

We zetten AI-agents in voor werk dat geen mens vereist: geautomatiseerde verkenning, repetitieve scans over grote aanvalsoppervlakken, correleren en dedupliceren van bevindingen, mappen naar compliance-frameworks en het opstellen van een eerste versie van hersteladvies. Dit geeft onze consultants ruimte vrij van de delen van het werk die een machine sneller en consistenter uitvoert.

Maar we hanteren strikte scopes voor elke agent die we inzetten. Gedefinieerde doelen. Gedefinieerde technieken. Menselijke review voordat er iets consequentiefs gebeurt. We richten geen autonome agent op een klantomgeving en kijken dan wat er uitkomt.

De reden is simpel: geautomatiseerde tools genereren bevindingen. Menselijke testers begrijpen wat die bevindingen betekenen voor een specifiek bedrijf. Onze taak is om beide te doen, automatisering inzetten waar het snelheid en dekking toevoegt, en menselijk oordeel toepassen waar het inzicht toevoegt.

Waar dit naartoe gaat (eerlijk gezegd)

Anthropic schat dat Mythos-klasse mogelijkheden binnen 6 tot 18 maanden breed beschikbaar zullen zijn via meerdere AI-labs. Wanneer dat in commerciële tooling terechtkomt, ziet de markt er anders uit.

Ontdekking van bekende kwetsbaarheidsklassen wordt vrijwel volledig geautomatiseerd. Exploitontwikkeling voor standaard kwetsbaarheidspatronen wordt snel en goedkoop. Rapportage, compliance-mapping, hersteladvies: gecommoditiseerd.

Dit creëert twee risico's die parallel lopen. Voor verdedigers: een vloed van bevindingen die bestaande herstelprocessen niet kunnen verwerken. Voor aanvallers: dezelfde mogelijkheden, zonder de toegangscontroles. De mediane tijd van kwetsbaarheidsopenbaarmaking tot werkende exploit is al ingestort van 125 dagen in begin 2025 naar minder dan een halve dag in april 2026. Mythos versnelt dat verder.

De pentesters die dit het meest zullen voelen, zijn degenen wier werk momenteel bestaat uit het draaien van tools, het opschrijven van de output en dat een pentest noemen. Dat model staat onder serieuze druk, en de tijdlijn is korter dan de meesten willen toegeven.

Degenen die het goed zullen hebben, zijn de professionals die opschuiven naar adversary simulation, AI-systeembeveiliging (prompt injection, agentische exploit-chains, RAG-vergiftiging), beveiligingsarchitectuur en de strategische laag waar modellen simpelweg niet op opereren.

Conclusie

Handmatig pentesten verdwijnt niet. Maar de beste versie ervan ziet er anders uit dan drie jaar geleden.

Het juiste model is: menselijke pentesters die AI inzetten om minder tijd te besteden aan het repetitieve werk, zodat ze meer tijd kunnen besteden aan de delen die echt een mens vereisen. Jouw bedrijf begrijpen. Jouw dreigingsmodel. Jouw specifieke risicocontext. Het creatieve adversariale denken dat geen enkele benchmark tot nu toe heeft weten te automatiseren.

Voor CISO's is de boodschap: jaarlijkse point-in-time pentests zijn op zichzelf toenemend ontoereikend. Continue geautomatiseerde validatie gecombineerd met periodieke expert-geleide engagements is de nieuwe baseline, geen premiumoptie.

Voor pentesters: de tools zijn niet je concurrent. De pentesters die de tools gebruiken, zijn dat wel. Zorg dat je er nu al mee bezig bent.

Bij Protea Security is dat hoe wij werken. Als je wilt begrijpen hoe dat er voor jouw omgeving uitziet, vind je ons op proteasecurity.com.

Bronnen

  1. Petronella Cybersecurity News, Automated Penetration Testing Tools: 2026 Comparison (maart 2026) — https://petronellatech.com/blog/automated-penetration-testing-tools-comparison-2026/
  2. Escape, Top Automated Penetration Testing Tools (2026)https://escape.tech/blog/top-automated-pentesting-tools/
  3. Penligent, Best AI Pentesting Tools in 2026 (april 2026) — https://www.penligent.ai/hackinglabs/best-ai-pentesting-tools-in-2026/
  4. General Analysis, Best Automated Penetration Testing Platforms in 2026 (mei 2026) — https://generalanalysis.com/guides/best-automated-penetration-testing-tools
  5. Aikido, Top 18 Automated Pentesting Tools Every DevSecOps Team Should Knowhttps://www.aikido.dev/blog/top-automated-penetration-testing-tools
  6. StackHawk, Best AI Pentesting Tools in 2026: Top Picks Comparedhttps://www.stackhawk.com/blog/ai-pentesting-tools/
  7. Stingrai, Top 10 Automated Pentesting Tools 2026 (juni 2026) — https://www.stingrai.io/blog/top-10-automated-penetration-testing-tools-2026
  8. Redfox Cybersecurity, Best AI Pentesting Tools in 2026: Hands-On Comparison (mei 2026) — https://www.redfoxsec.com/blog/best-ai-pentesting-tools-in-2026-a-hands-on-comparison
  9. Security Online, 5 Best Autonomous Penetration Testing Tools in 2026 (april 2026) — https://securityonline.info/5-best-autonomous-penetration-testing-tools-in-2026/
  10. Gartner Peer Insights, Best Adversarial Exposure Validation Reviews 2026https://www.gartner.com/reviews/market/adversarial-exposure-validation
  11. Astra Security, Automated vs Manual Penetration Testing: Which One Do You Need? (januari 2026) — https://www.getastra.com/blog/security-audit/automated-vs-manual-penetration-testing/
  12. FreeCodeCamp, Penetration Testing: Services vs Automated Platforms: What's Better in 2026? (maart 2026) — https://www.freecodecamp.org/news/penetration-testing-services-vs-automated-platforms-what-is-better
  13. Matproof, Automated vs Manual Penetration Testing: A Complete Comparison for 2026 (maart 2026) — https://matproof.com/blog/automated-vs-manual-penetration-testing
  14. InfosecOne, AI vs Penetration Testers 2026: Will Automated Testing Replace Your Penetration Testing Job (november 2025) — https://infosecone.com/blog/ai-impact-penetration-testing-careers-and-job-market/
  15. ioSENTRIX, AI-Driven Penetration Testing in 2026: Benefits, Limits, and the Hybrid Future (november 2025) — https://iosentrix.com/blog/ai-driven-penetration-testing
  16. Simbian, AI Penetration Testing vs. Manual Pentesting: Which is Right for You in 2026? (maart 2026) — https://simbian.ai/blog/ai-penetration-testing-vs-manual-pentesting-which-is-right-for-you-in-2026
  17. DeepStrike, Manual vs Automated Penetration Testing: The 2025 Guidehttps://deepstrike.io/blog/manual-vs-automated-penetration-testing
  18. Anthropic, Assessing Claude Mythos Preview's Cybersecurity Capabilities (april 2026) — https://red.anthropic.com/2026/mythos-preview/
  19. AISI, Our Evaluation of Claude Mythos Preview's Cyber Capabilities (april 2026) — https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities
  20. Bishop Fox, Anthropic's Claude Mythos Preview: The AI Cybersecurity Inflection Point (april 2026) — https://bishopfox.com/blog/anthropics-claude-mythos-preview-the-ai-cybersecurity-inflection-point
  21. Built In, The Conversation About Claude Mythos Misses a Bigger Risk (juni 2026) — https://builtin.com/articles/claude-mythos-analysis
  22. ArmorCode, Anthropic's Claude Mythos and What it Means for Security (april 2026) — https://www.armorcode.com/blog/anthropics-claude-mythos-and-what-it-means-for-security
  23. Tahir via Medium, Assessing Anthropic Claude Mythos Preview's Cybersecurity Capabilities (april 2026) — https://medium.com/@tahirbalarabe2/assessing-anthropic-claude-mythos-previews-cybersecurity-capabilities-251a4e0a2137
  24. Petronella Technology Group, Claude Mythos: Anthropic's April 2026 AI Preview (mei 2026) — https://petronellatech.com/blog/claude-mythos-guide-2026/
  25. Anthropic, Expanding Project Glasswinghttps://www.anthropic.com/news/expanding-project-glasswing
  26. Post Quantum, Anthropic's Mythos Preview and the End of a Twenty-Year Cybersecurity Equilibrium (april 2026) — https://postquantum.com/security-pqc/anthropic-mythos-preview-ai-offensive-security/
  27. Anthropic, Project Glasswing: Securing Critical Software for the AI Era (april 2026) — https://www.anthropic.com/glasswing

Wilt u dit toepassen op uw eigen omgeving?

Neem contact op

Lees verder

Klaar om uw organisatie door de ogen van een aanvaller te zien?

Neem contact op