Salta al contenuto

Il sistema AI multi-agente di Microsoft supera Mythos di Anthropic

Ma solo secondo dichiarazioni dell'azienda.

In breve:

Microsoft ha presentato MDASH, un sistema AI per trovare vulnerabilità nel software che include oltre 100 agenti specializzati: alcuni cercano possibili falle nel codice, altri verificano se siano reali e altri provano a costruire un attacco dimostrativo. Secondo Microsoft, MDASH ha ottenuto l’88,45% su CyberGym, test basato su vulnerabilità note in progetti open source, contro l’83,1% di Mythos Preview di Anthropic e l’81,8% di GPT-5.5. I risultati però sono dichiarati dall'azienda e non verificati da un soggetto indipendente. Microsoft dice di usare MDASH internamente e di aver scoperto 16 nuove vulnerabilità in Windows, incluse quattro falle importanti.

Questo testo è un riassunto del seguente articolo (eng):

Geekwire - Microsoft’s multi-agent AI system tops Anthropic’s Mythos on cybersecurity benchmark

Riassunto completo:

Questo post è solo per gli iscritti

Accedi

A quanto pare non sei loggato.

Più recenti