Phenaki

Un modèle pour générer des vidéos à partir de texte.

Accès à Phenaki (Libre)

Fonctionnalités de Phenaki Phenaki est un modèle d'IA pour générer des vidéos pouvant durer plusieurs minutes directement à partir de texte. Vous pouvez également générer une vidéo à partir d'une image fixe et d'un prompt. L'encodeur-décodeur vidéo proposé surpasse toutes les bases par image actuellement utilisées dans la littérature en termes de qualité spatio-temporelle et de nombre de tokens par vidéo. Pour générer des tokens vidéo à partir de texte, ils utilisent un transformeur masqué bidirectionnel conditionné sur des tokens de texte pré-calculés. Les tokens vidéo générés sont ensuite dé-tokenisés pour créer la vidéo réelle.