OpenAI lancia Sora: generatore di immagini Text-to-Video.

Sora di OpenAI (imm.systemscue.it)
Senza tanti preavvisi OpenAI sta lanciando Sora, un nuovo generatori di immagini Text-to-Video capace di trasformare istruzioni testuali in video fotorealistici.
Sora è al momento nella sua fase sperimentale e quindi ancora non pronto per essere immesso sui mercati informatici globali, e tutto il sistema sta venendo testato da una squadra selezionata di creator ed esperti in sicurezza.
Da quello che è stato diffuso, Sora è in grado di generare video fino a 60 secondi con qualità in HD partendo da un testo, e dovrebbe essere un vero e proprio salto in davanti rispetto al sistema Dall-E 3 sempre di OpenIA, od anche a Stable Diffusion e Midjourney.
La fase sperimentale di Sora.
OpenIA ha pubblicato vari video dimostrativi che fanno intuire quali siano le potenzialità di questo sistema, ma l’azienda statunitense non ha al momento diffuso né le specifiche tecniche né i dettagli di funzionamento di Sora, e non è stato neanche dato in anteprima ai giornalisti specializzati in tecnologia per testarne le capacità e le possibilità ed al momento non è ancora stato reso pubblico di quanto sarà ufficialmente lanciato.
Da i video diffuso è facile capire di come Sora sia salto in avanti rispetto agli attuali modelli generativi text-to-video ed in commercio come Pika o Runaway, tra l’altro arrivato alla seconda generazione.
Le demo diffuse e visibili nelle pagine ufficiale di Sora, probabilmente rappresentano una selezione ben ponderata di immagini scelte e quindi non è ancora facile capire quali siano le effettive potenzialità.

Da quanto si capisce, Sora è in grado di generare scene complesse con più protagonisti, tipologie di movimento e dettagli molto accurati delle scene di sfondo e dei soggetti rappresentati e la principale innovazione sembrerebbe quella che il modello comprende con solo quello che l’utente ha impostato nel prompt, ma anche rappresentarle come se siano nel mondo fisico reale.
Quest’ultimo modello è importante in quanto tutti i sistemi al momento in commercio, sono in difficoltà nel mantenere la coerenza delle scene e degli elementi che la costituiscono, spesso ci si trova con immagini od oggetti che scompaiono senza motivo, proporzioni non corrette e tanto altro, mentre Sora dovrebbe fare un passo avanti anche da questo punto di vista.
Le demo messe in rete da OpenIA di Sora.
Ovviamente anche Sora è ancora nella fase embrionale e di affinamento del sistema, e nelle Demo distribuite si vedono molte imperfezioni, ma già appare evidente di come la qualità dei dettagli sia assolutamente migliore rispetto a tutto quanto in circolazione. Infatti, ancora sono tanti gli aspetti da perfezionare e mettere a punto rispetto alla ricostruzione di interi scenari, primi piani, riprese da droni, close up ed altro.

Tra le demo diffuse troviamo due video sperimentali che danno una prima visione delle nuove potenzialità di Sora: nel primo video si vedono due ragazzi che camminano mano nella mano sul marciapiede seguiti da un drone, e qui i difetti soprattutto rispetto le proporzioni del contorno sono evidenti; nel secondo video è rappresentata una donna che cammina di notte in città su una strada bagnata dalla pioggia, con buona qualità delle luci, dei riflessi della pioggia sull’asfalto bagnato, facendo trasparire di come la qualità di Sora, anche se in una Demo sia di altro livello rispetto all’esistente.
I collaudi ed i test.
In conclusione, l’azienda dichiara che Sora è in fase di sperimentazione avanzata condotta dai suoi red teamer, che sono una squadra di esperti interna, con il compito di attaccare il sistema per testarne sia la vulnerabilità, sia per individuare le tante zone critiche da mettere a punto.
Questo per cercare di evitare al massimo, una volta che sarà immesso sui mercati, che venga facilmente messo in difficoltà da hacker e criminali informatici in genere.
Approccio sicuramente prudente, che è tra l’altro affiancato in questa fase sperimentale da una serie di designer, registi ed artisti visivi selezionati, per ottenere un riscontro su come sviluppare Sora dal punto di vista della creatività.
Tutto questo con l’obiettivo non nascosto di rivoluzionare l’industria dei video.