
前回のFramePackの記事はこれ。https://note.com/ai_renkin/n/n26b32fc238e5
この記事では FramePack one-click パッケージ(CUDA 12.6/PyTorch 2.6) を Windows 11 へ導入し、xFormers・Flash-Attention 2・Sage-Attention を追加して “とりあえず速く動かせる” ところまでを 完全初心者向け に説明します。
最終的にあなたは
- デスクトップ直下に 
framepack_cu126_torch26フォルダがあり run.batをダブルクリックするだけで WebUI が立ち上がり- RTX 40 系 GPU/8 GB でも 3〜5 秒/iter 程度で 5-10 秒動画が作れる
 
――という状態になります。
Framepack 高速化動かない?
Framepackをインストールしたけど遅いという場合に高速化ライブラリで速く処理する事が可能です。
ですが高速化をインストールしてもエラーになるというケースもあります。
この問題は、以下の手順で行う事でスムーズに正常稼働する事ができます。
| ゴール | 内容 | 
|---|---|
| FramePack を “普通の Windows PC” に入れる | VRAM 6 GB でも OK なローカル版 | 
| 高速化ライブラリもワンクリックで導入 | xformers / Flash-Attn / Sage-Attn | 
| 実際に GUI を開いて動画を出す | ブラウザでポチポチ操作するだけ | 
では順番に解説します。
FramepackとFramepack高速化に必要なファイルをダウンロード(安全な最短コース)
まず、
https://github.com/lllyasviel/FramePack
スクロールすると下記のようなダウンロードリンクがあります。

上記からFramePackをダウンロードをする。
次に、高速化ファイルもダウンロードします。
https://github.com/lllyasviel/FramePack/issues/138
スクロールすると下記のようなダウンロードリンクがあります。

ここからダウンロードします。
同じデスクトップにダウンロードしておくと分かり易いです。
| 置くもの | 役割 | 入手先 | 配置パス (例) | 
|---|---|---|---|
| framepack_cu126_torch26(フォルダ) | FramePack WebUI と最小限の Py 環境 | GitHub の 「>>> Download One-Click Package (CUDA 12.6 + PyTorch 2.6) <<<」 | C:\Users\<あなた>\Desktop\framepack_cu126_torch26\ | 
| mod_package_installer_unified.bat(※Include / Libs フォルダも一緒に同梱済み) | PyTorch 2.6 + CUDA 12.6 環境を整え、xformers / flash-attn / sage-attn / triton を自動導入 | GitHub Issue #138 内の Package Installer V3(または本体に同梱済みのことも多い) | C:\Users\<あなた>\Desktop\framepack_cu126_torch26\ ← フォルダ直下に置くだけ | 
| run.bat | WebUI を起動 | FramePack 本体に最初から入っている | 〃(フォルダ直下) | 
| ステップ | コマンド / 操作 | 補足 | 
|---|---|---|
| 1 | FramePack Zip を展開し、フォルダごと デスクトップへ置く | 展開先はどこでも良いが、以降の説明が楽なので Desktop に統一 | 
| 2 | 同じ階層にある mod_package_installer_unified.bat を 右クリック → 管理者として実行 | Include / Libs が自動でコピーされ、ライブラリがそろう。※2 回目以降は「Already satisfied」と出て高速終了 | 
| 3 | 完了後、run.bat をダブルクリック | コンソールにXformers is installed!Flash Attn is installed!Sage Attn is installed!と緑字で出れば高速化 OK | 
Framepackのフォルダを展開して準備
結果としてこの状態。

Framepackを先にダウンロードして起動している場合は、一度全部削除してやる方が上手くいくかもです。
フォルダ直下の構成がこうなっていれば OK
framepack_cu126_torch26
├─ include ← 追加※高速化分
├─ libs ← 追加※高速化分
├─ system
├─ webui
├─ run.bat
├─ environment.bat
└─ mod_package_installer_unified.bat
やすフォルダの中を この状態にしたらOKです。次はインストールしていきます。※今の作業はダウンロード。一切何も触らずに並べただけの状態です。
高速化ライブラリを一括インストール
フォルダ内の空白を Shift+右クリック → 「PowerShell ウィンドウをここで開く」
次の 1 行を実行(管理者権限不要)
.\mod_package_installer_unified.bat
途中 “Press any key to continue …” が出たら Enter
5〜10 分で torch/cu126・xformers・flash-attn・sageattention が揃います。== Successfully Installed/Verified Successfully == と出れば完了。
まとめると…
- 最初にダウンロードしたファイルは解凍する。
 - 解凍したframepack_cu126_torch26の中にpackage_installer_V3.zipの解凍したフォルダの中身も移動させる。
 - framepack_cu126_torch26の中身が揃っている事を確認する。
 - 確認してからframepack_cu126_torch26のフォルダ内でshellを起動。
 
最後に、
.\mod_package_installer_unified.bat
これをそのままshellで貼り付けるだけです。
WebUI の起動と停止
| 操作 | 方法 | 
|---|---|
| 起動 | run.bat をダブルクリック(初回はモデル 30 GB ほど自動 DL) | 
| 停止 | PowerShell/黒いウィンドウをアクティブにして Ctrl + C → Y | 
あるいは強制終了ならshellのウィンドウを閉じてもOKです。
起動する場合は、


毎回ここをクリックするだけです。
まず試す推奨パラメータ
| 項目 | 値 | 解説 | 
|---|---|---|
| Total Video Length | 5 s | 速さ体感用 | 
| Steps | 25 | デフォルト | 
| TeaCache | ON | 速度 1.5〜2 倍/手先が若干荒れる可能性有り。質重視なら触らない。 | 
| CFG Scale | 10 | 触らない | 
| Preserved Memory (GB) | 6(8 GB GPU) / 4(12 GB GPU 以上) | 数字を下げるほど速いが OOM に注意 | 
動画のサイズの変更方法
縦長(スマホ向け 9:16 や 3:4 など)の動画も作れます。
やり方は ①UI だけで済む方法 と ②設定ファイルを書き替えて固定する方法 の 2 通りあります。
――GPU‐VRAM に余裕があればそのまま、6 GB クラスなら解像度を少し落として試してください。
① UI だけで縦長を出す(最も手軽)
- 入力画像を “縦長” で用意
- 例:720 × 1280、512 × 768 など。FramePack は “入力画像の縦横比をキープ” する仕様なので、入口が縦なら出力もその比率になります。
 
 - 解像度スライダーを調整
- 「Resolution」 は “長辺側のピクセル数”。
 - たとえば 720 × 1280 の縦画像ならスライダーを 720 付近に合わせる。
 - 512 × 768 の時は 512。
 
 - 他のパラメータはそのまま Start Generation
 - 右側プレビューに “縦長” 動画(mp4)が生成されます。
 



縦長のまま SNS へ直接アップするなら、解像度は 720 × 1280 までに収めておくと VRAM 6 GB でも安全です。
毎回いじるのが面倒なら固定してしまう
webui\demo_gradio.py をメモ帳で開く
ファイル冒頭〜100 行目あたりにあるデフォルト解像度を探す
DEFAULT_RESOLUTION = 512     # ← 高さ側(長辺)
DEFAULT_ASPECT_W   = 9       # ← 幅比
DEFAULT_ASPECT_H   = 16      # ← 高さ比
(バージョンにより変数名が少し違います)
好きな値に書き換え → 保存
例:1080 × 1920 にしたい
DEFAULT_RESOLUTION = 1080
DEFAULT_ASPECT_W   = 9
DEFAULT_ASPECT_H   = 16
run.bat を再起動
→ UI 起動直後から縦長プリセットになっています。
※縦横とも 16 の倍数 で指定するとエンコード時のエラーを避けやすい。
VRAM と解像度のざっくり目安
| VRAM | 16:9 横 | 9:16 縦 | 備考 | 
|---|---|---|---|
| 6 GB | ~512×912 | ~512×768 | TeaCache ON 前提 | 
| 8 GB | ~640×1136 | ~640×960 | Preserved Mem 6 GB のまま | 
| 12 GB 以上 | ~960×1700 | ~720×1280 が安定 | High-VRAM モード推奨 | 
よくあるトラブルと解決方法
| Q | A | 
|---|---|
| 左右に黒帯が付く/上下が切れる | 入力画像とスライダー解像度の縦横比がずれている。・画像を欲しい比率にトリミングして入れる・Force aspect from image チェックがあれば ON | 
| 縦長にしたら OOM で落ちる | Resolution をワンランク下げる / Preserved Mem を 8→10 GB に上げる | 
| TikTok 用 1080×1920 を一発で出したい | VRAM 12 GB 以上なら可能。6~8 GB GPU なら 720×1280 で出して別ソフトでアップスケール推奨 | 
これで FramePack でも縦長リール/ショート向け動画 が簡単に作れます。
まずは入力画像を縦にしてスライダーを合わせる――ほんの 10 秒で試せるのでやってみてください!
FramePack 万が一動作が挙動不審の場合
FramePack の Python 仮想環境に入る
cd “C:\Users\アカウント名\Desktop\framepack_cu126_torch26\system\python”
自分のアカウント名は置き換えて下さいね。↑
.\python.exe -m pip uninstall -y flash-attn xformers sageattention triton-windows pynvml
これで高速化が外れた状態になります。
使い方
1枚の画像をセットしてプロンプトを加えるだけです。
テキストのみでは動画は作れません。
FramePack は「次フレーム予測(next-frame section prediction)」モデルだからです。
- 初期フレーム(=静止画) を受け取り
 - その絵が動き出すように 1 → 2 → 3… とフレームを延長する仕組み
 
したがって 入力 0 フレーム(テキストのみ)では拡張の起点がなく、モデル側でエラーになります。
どうしてもテキストだけで動画を作りたい場合は?
| 方法 | ざっくり手順 | 備考 | 
|---|---|---|
| ① Stable Video Diffusion (SVD-XT など) 系を使う | * Text-to-Image で 1 枚生成 * その画像を SVD など別モデルに渡して動画化 | 別ツール/セットアップが必要 | 
| ② 空白画像を自分で用意する (単色 512×512 など) | * まっ白 or まっ黒画像をアップ * Prompt で動きを指定 | 背景が一色なので違和感が出やすい | 
動画はマネタイズに不向きな理由
結局のところ、
「わーすごいできた!」と体験した後は削除しました(笑)
そもそも仮に動画が作れるとしても、ここまで時間を要すると、かなり厳しい。
この手の動画の場合は、
- TIKTOK
 - YouTube動画※ショートを含む
 - インスタグラム
 
などが定番ですが、今、動画を生成しても、収益性は極めて低い。
もはや趣味で使う程度の事ですが、趣味で生成動画を作成して楽しめるとは思えません(笑)
総合的に考えると、FramePack=玩具…という感じでしょうか。
もしも、ビジネスでの利用を検討しているなら、外部の動画生成サイトの利用が好ましいですね!
| サービス | 特徴 | 料金体系 | 向いている用途 | 
|---|---|---|---|
| RunwayML / Pika | 単一 UI でテキスト→動画・画像→動画を一括 | 無料枠+従量 | SNS に載せる 5〜10 秒のループ動画 | 
| Colab(FramePack Notebook 版) | Google の GPU を時間貸しで使える※混雑時は待ち時間あり | 無料(T4)/Pro(A100 ≈ $0.12〜/h) | 個人作品・社内デモ | 
| Replicate | API 呼び出しのみ。コードが書ける人向け | 1 min 推論あたり ~$0.01〜 | SaaS 組み込み | 
| HeyGen / Synthesia | テンプレ多・音声合成とセット | 文字単価 or 月額 | 社内教育・営業資料 | 
“生成系で稼ぐ” なら――文章コンテンツ一択の理由
検索トラフィックの主役は依然テキスト
- Google 検索 → ブログ/note → 広告 or 有料記事/メルマガ → 収益化
 - 動画は YouTube 特化型。ショートの競争も激化し CPM が低い。
 
制作サイクルが圧倒的に速い
- ChatGPT で 2,000 文字なら 5 分。
 - 動画 30 秒=推論 5 分+編集 10 分+エンコード 3 分 → 倍以上の工数。
 
マネタイズ導線の多さ
| モデル | 期待単価 | 必要 PV / 月 | 例 | 
|---|---|---|---|
| アフィ記事 | ¥0.3 〜 1 / PV | 30 k 〜 | ガジェットレビュー | 
| note 有料 | ¥300 / 本 | 100 本 × 100 部 | Web 制作 HOWTO | 
| Kindle | ¥400 / 冊 | 50 冊 × 月20 部 | ジャンル絞り攻略本 | 
法律・ガイドラインが比較的クリア
- 動画生成は著作権(元画像・楽曲・商用利用)の灰色地帯がまだ多い。テキストは引用ルールで処理しやすい。
 
FramePack まとめ
- FramePack = クリエイターの“おもちゃ” と割り切れば楽しい。
 - 但し収益化を狙うなら、文章コンテンツがまだまだ王道。
 - 動画生成は「外部 GPU で一気に回す」「テキスト資産の補助」に留める方が費用対効果◎。
 



参考にしてください。これを ブン回す方が金になりますよw












コメント