In breve:
Anthropic propone un accordo tra i principali laboratori AI per fermare o rallentare i modelli più potenti se iniziassero a migliorarsi da soli oltre una soglia gestibile. Il timore riguarda il “miglioramento ricorsivo”: sistemi capaci di scrivere codice e progettare versioni successive di se stessi con sempre meno controllo umano. Anthropic chiede una pausa coordinata e verificabile tra aziende, per evitare che qualcuno continui in segreto mentre gli altri rallentano. OpenAI spinge invece per regole decise dai governi democratici, non dalle imprese. Il tema arriva mentre strumenti AI accessibili pubblicamente sono già stati usati in test per creare malware capaci di diffondersi e adattarsi ricorsivamente durante l’attacco.
Questo testo è un riassunto del seguente articolo (eng):
