Stable Diffusion scende in pista mentre Midjourney e Runway competono con il suo nuovo strumento che ti consente di creare video di quattro secondi con… Convocato. Ciò restringe la corsa allo sviluppo della soluzione più potente nell’animazione basata sull’intelligenza artificiale (AI).
Stability AI, la società che lo ha sviluppato programmaha annunciato in un comunicato l’esistenza delle sue nuove funzionalità nello stesso periodo in cui OpenAI, il team responsabile del modello linguistico ChatGPT, annunciava una funzione che consente conversazioni con i suoi utenti in tutto il mondo.
Tuttavia la pubblicazione di video è ancora in una fase di test iniziale Non ha una data di uscita globale confermata, ma questa piattaforma open source ha già dimostrato una grande capacità di creare sequenze animate basate su immagini fisse.
Limitazioni su questo Programmazione È ancora molto chiaro. Ad esempio, non è possibile creare volti umani quando non si dispone di un’immagine di riferimento, quindi sei limitato a quello Animazione con protagonisti creature e animali dei cartoni animati; O semplicemente visualizza paesaggi animati. Inoltre non ha la capacità di ruotare una sequenza molto complessa, ma crea effetti di spostamento.
Attualmente il suo processo artistico comprende solo due modelli Immagine in video: SVD che converte immagini con una risoluzione di 576 x 1024 in video in 14 fotogrammi, e un altro noto come SVX-XT che permette l’aggiunta fino a 25 fotogrammi che, combinati insieme, sviluppano una transizione di un certo livello di complessità. Entrambi offrono la possibilità di impostare il frame rate al secondo fino a un massimo di 30.
Stable Video Difussion è addestrato con un database composto da centinaia di migliaia di immagini e brevi animazioni. Più utenti lavorano con la piattaforma, migliori saranno i risultati che inizierà a fornire.
Fino ad ora, i movimenti della telecamera non potevano essere controllati utilizzando il testo o la visualizzazione di parole o lettere, quindi le sequenze venivano generate in modo casuale o nel modo più logico trovato dallo strumento per spostare una determinata scena o oggetto.
Le sue capacità generative hanno un grande potenziale in settori quali la pubblicità, l’istruzione, l’intrattenimento e la progettazione grafica mirata ad annunci in formati mobili. Una delle sue funzioni più interessanti è che lo consente Fa Oggetti quasi 3D con texture altamente dettagliate da visualizzare da qualsiasi angolazione.
Possono partecipare gli utenti che desiderano mettere alla prova le proprie capacità Lista d’attesa. Attualmente il principale concorrente per Stable Video Difussion è Runway, le soluzioni di Pika Labs e Midjourney, tutte piattaforme che aprono un nuovo capitolo nella corsa a quale sarà la più redditizia. Attualmente l’arte generativa deve affrontare molti limiti, ma a poco a poco si stanno facendo progressi significativi in questo campo, soprattutto dal lato della democratizzazione dell’intelligenza artificiale.
“Educatore generale della birra. Pioniere del caffè per tutta la vita. Sostenitore certificato di Twitter. Fanatico di Internet. Professionista dei viaggi.”