Un modello per generare video dal testo.
Accesso a Phenaki (Gratuito)
Caratteristiche di Phenaki Phenaki è un modello di intelligenza artificiale per generare video che possono durare diversi minuti direttamente dal testo. Puoi anche generare un video da un'immagine statica e un prompt. Il codificatore-decodificatore video proposto supera tutti i metodi basati su singoli fotogrammi attualmente utilizzati in letteratura in termini di qualità spazio-temporale e numero di token per video. Per generare token video dal testo, stanno usando un trasformatore mascherato bidirezionale condizionato su token di testo pre-calcolati. I token video generati vengono successivamente de-tokenizzati per creare il video vero e proprio.