In breve:
Microsoft ha presentato MDASH, un sistema AI per trovare vulnerabilità nel software che include oltre 100 agenti specializzati: alcuni cercano possibili falle nel codice, altri verificano se siano reali e altri provano a costruire un attacco dimostrativo. Secondo Microsoft, MDASH ha ottenuto l’88,45% su CyberGym, test basato su vulnerabilità note in progetti open source, contro l’83,1% di Mythos Preview di Anthropic e l’81,8% di GPT-5.5. I risultati però sono dichiarati dall'azienda e non verificati da un soggetto indipendente. Microsoft dice di usare MDASH internamente e di aver scoperto 16 nuove vulnerabilità in Windows, incluse quattro falle importanti.
Questo testo è un riassunto del seguente articolo (eng):
Geekwire - Microsoft’s multi-agent AI system tops Anthropic’s Mythos on cybersecurity benchmark