In breve:
L’aggiornamento del suo nuovo modello text-to-video migliora l’aderenza ai prompt complessi e rende più naturali movimenti, impatti e dinamica di movimento dei liquidi. Restano però limiti nella capacità di seguire correttamente la scena: alcuni oggetti possono comparire o sparire senza motivo e certe azioni non rispettano sempre l’ordine logico causa-effetto. Il modello offre inoltre un controllo più stabile sui diversi stili visivi, dai fotorealistici ai cinematografici.
Riassunto completo:
- Runway ha presentato il suo modello di intelligenza artificiale da testo a video, Gen-4.5, che promette una maggiore accuratezza visiva e realismo nella creazione di contenuti.
- Questo modello genera video "cinematici e altamente realistici", rendendo difficile distinguere le produzioni dell'intelligenza artificiale da filmati reali.
- Il Gen-4.5 migliora la sua capacità di aderire a prompt complessi e simula la fisica con maggiore precisione, ad esempio nel movimento degli oggetti e nel flusso dei liquidi.
- La distribuzione del modello Gen-4.5 a tutti gli utenti avverrà gradualmente, mantenendo la stessa velocità ed efficienza del suo predecessore.
- Sono presenti alcune limitazioni, come problemi relativi alla permanenza degli oggetti e al ragionamento causale, che possono manifestarsi con effetti che precedono la loro causa.
- Il modello dimostra una migliore gestione di vari stili visivi, inclusi quelli fotorealistici, stilizzati e cinematografici, assicurando coerenza.
- Anche OpenAI, con il suo modello Sora 2, sta intensificando gli sforzi per aumentare il realismo dei video generati dall'intelligenza artificiale, in particolare riguardo alla fisica.
Questo testo è un riassunto del seguente articolo (eng):
Runway says its new text-to-video AI generator has ‘unprecedented’ accuracy
Is it real or is it AI?

Alternativa in italiano: HD Blog
