テキストから動画を生成するためのモデル.
へのアクセス先 Phenaki (無料)
Phenakiの特徴 Phenakiは、テキストから直接数分にわたる動画を生成できるAIモデルです. 静止画とプロンプトからも動画を生成できます. 提案されたビデオエンコーダーデコーダは、空間-時間的品質および動画あたりのトークン数の点で、現在文献で使用されているすべてのフレームごとのベースラインを上回ります. テキストから動画トークンを生成するために, 彼らは事前に計算されたテキストトークンに条件付けされた双方向マスクトランスフォーマーを使用しています. 生成された動画トークンは、その後デトークナイズされて実際の動画が作成されます.