動画生成 FramePack を RTX 4060 Ti 8GB で試してみました

2025/05/162025/04/28

当ページのリンクには広告が含まれています。

グラボ Nvidia RTX 30XX, 40XX, 50XX シリーズでローカル環境で動画が生成できるという、話題の「FramePack」が気になったので試してみました。

インストール

Windowsであれば公式のInstallを参考に、「>>> Click Here to Download One-Click Package (CUDA 12.6 + Pytorch 2.6) <<<」からダウンロードして、update.bat、run.batの順で行うと完了です。

もし高速化ライブラリを入れる場合は Issue #138 のmodを利用すると速いです。package_installer.zipを解凍して中身をFramePackのルートディレクトリに移動後、package_installer.batを実行して完了です。

実際に使ってみて

まず、できあがったものがこちらです。

FramePackで作成した動画

今回試したのは、1枚の画像を使い、プロンプトに「1回転して、海動かして」といった単純な指示を与えたものです。これだけのシンプルな設定にもかかわらず、クオリティの高い動画が作成されたのは素直にすごいなと感じました。

また、動画生成中にYouTubeを見たり、軽作業は普通にできました。動画を結合しているときは重たくなります。

使用した環境、動画の設定は以下になっています。

PC環境

CPU：Intel 13th Core i5 13500
GPU：GeForce RTX 4060 Ti 8GBモデル
メモリ：32GB

動画設定

動画サイズ：512×768ピクセル
TeaCache：OFF
Total Video Length (Seconds)：5
Steps：25
Distilled CFG Scale：7
GPU Inference Preserved Memory (GB) ：7

生成時間

RTX 4060 Ti 8GBモデルだと5秒の動画に約40分かかりました。単純計算すると1秒の動画に約8分かかるようです。

それで、動画のフレームレートを確認したところ30fpsでした。つまり、480秒 ÷ 30枚 = 1枚あたり約16秒で画像が生成されている計算になります。この分野には全く詳しくないので断言はできませんが、ローカルマシンで、しかもそこまでハイスペックではないこのグラボ（RTX 4060 Ti 8GB）でこの速度が出るのは、かなり早いほうだと思いました。もちろん画像サイズにも影響されるとは思います。

とはいえ、5秒の動画を作るのに約40分はかかるので、絶対的に見れば時間はかかる部類かもしれません。それでも、これだけのクオリティの動画をクラウドを使わず自分のPCだけで完結できるのは、やっぱり驚きです。

ちなみに、TeaCacheという高速化機能を使うと、1秒の動画が約5分ほどで生成できました。TeaCacheの機能については、手っ取り早い話が「速さを取るならTeaCache ON」「品質を取るならTeaCache OFF」とChatGPTが教えてくれました。

TeaCacheについて（公式情報をChatGPTで要約）

TeaCacheをONにすると、速度が大幅に向上する。

RTX 4090の場合、通常2.5秒/フレーム → TeaCache有効で1.5秒/フレームに短縮される。

TeaCacheはメモリを使って一部の中間結果をキャッシュ（再利用）する仕組み。

速度を重視するならON推奨だが、メモリに余裕がない場合はOFFにしてもOK。

TeaCacheは処理を高速化するための仕組みだが、結果に影響を与える場合がある（＝完全にロスレスではない）。

アイデア出しや素早い試行（プロトタイピング）にはTeaCacheをONにする

最終的に高品質な結果を求めるときはTeaCacheをOFFにして、完全なディフュージョン処理を行うことが推奨されている。