FLUX.2 KleinはBlack Forest Labsが2026年1月に公開した最速モデルで、Distilled版なら4ステップ・サブ秒生成が可能です。本記事ではComfyUI v0.22.0環境で4Bモデルを動かす手順を、ファイル配置・KSampler設定・トラブル対処までまとめます。
必要環境
| 項目 | 推奨スペック |
|---|---|
| GPU | RTX 3060 12GB以上(4B FP8)/RTX 4070以上推奨 |
| VRAM | 8GB(Q4 GGUF量子化)/12GB(FP8) |
| ComfyUI | v0.9.2以降(v0.22.0推奨) |
| Python | 3.10〜3.13 |
| OS | Windows 10/11、Linux、macOS(Apple Silicon可) |
FLUX.2は新サンプリングアーキテクチャを使うため、ComfyUIが古いとテンプレート不足や生成失敗が起こります。先に update_comfyui.bat で最新化しておくのが必須です。
必要ファイルと配置先
Hugging Faceの公式リポジトリから以下を取得し、ComfyUIのmodelsディレクトリに配置します。
`
ComfyUI/
└─ models/
├─ diffusion_models/
│ ├─ flux-2-klein-base-4b-fp8.safetensors # Base版
│ └─ flux-2-klein-4b-fp8.safetensors # Distilled版
├─ text_encoders/
│ └─ qwen_3_4b.safetensors # T5代替テキストエンコーダ
└─ vae/
└─ flux2-vae.safetensors # 専用VAE
`
VAEはFLUX.1のものと互換性がないため、必ずFLUX.2専用のものを使ってください。
KSamplerの最適設定
DistilledかBaseかで設定が完全に分かれます。混在させると破綻するので注意。
Distilled版(高速・推奨)
- steps: 4
- cfg: 1.0〜1.5
- sampler: euler
- scheduler: simple
- denoise: 1.0
Base版(高品質)
- steps: 20
- cfg: 3.5
- sampler: euler
- scheduler: beta
- denoise: 1.0
公式ワークフローの取り込み手順
1. https://docs.comfy.org/tutorials/flux/flux-2-klein から公式ワークフロー画像(PNG)をダウンロード
2. ComfyUIのキャンバスにPNGを直接ドラッグ&ドロップ
3. ノード未解決があれば ComfyUI-Manager の Install Missing Custom Nodes を実行
4. 上記KSampler設定を反映して Queue Prompt
トラブル対処早見表
| 症状 | 原因 | 対処 |
|---|---|---|
| 画像が黒一色 | VAE不一致 | flux2-vae.safetensorsを使う |
| `KeyError: time_in` | ComfyUIが古い | v0.9.2以降に更新 |
| OOMエラー | VRAM不足 | Q4 GGUFモデルに切替・解像度を1024に下げる |
| 文字がぼやける | Distilled版でcfg高すぎ | cfgを1.0〜1.5に調整 |
| 生成が極端に遅い | text encoderがGPUに乗ってない | `--highvram` フラグ追加 |
マルチリファレンス機能の使い方
FLUX.2 Kleinは最大8枚の参照画像を入力可能で、キャラクター一貫性に大きく寄与します。
1. FluxReferenceImageEncode ノードを追加
2. 参照画像を2〜8枚ロード(同じキャラの別アングルが理想)
3. ノードのstrengthは0.6〜0.85が安定域
4. プロンプトには差分(衣装変更、背景変更)のみ記述
LoRAなしでも高い一貫性が出るため、新規キャラ展開の初期段階で重宝します。
性能を引き出す追加チューニング
- FP8量子化:NVIDIA RTX 40/50系ならFP8でVRAM約40%削減・速度40%向上
--use-sage-attention:RTX 4090で15〜25%の高速化- 解像度:1024×1024が最適、1280×720も品質維持しやすい
- batch_size:8GB VRAMなら1固定、12GB以上なら2まで
まとめ
FLUX.2 Klein 4Bは「軽量・高速・商用可」の3拍子が揃った2026年の本命モデルです。Distilledで4 step運用を基本にし、品質を詰めたいシーンだけBase版に切り替える二段構えが現実解。マルチリファレンス機能と組み合わせれば、LoRA学習を回す前にかなりの一貫性を確保できます。
次回はFLUX.2 LoRA学習のベストプラクティスを、SDXLとの違いを軸に解説します。
関連記事
- [AI画像生成 最新ニュース7選【2026年5月】](https://ikuriblog.com/ai-image-generation-news-may-2026/)
- [FLUX.2 LoRA学習徹底比較|SDXLとの違い](https://ikuriblog.com/flux2-lora-training-vs-sdxl-2026/)
よくある質問(FAQ)
Q1. 8GB VRAMでもFLUX.2 Kleinは動く?
Q4 GGUF量子化モデルを使えば8GB VRAMでも動作します。ただしFP8版より遅く、batch_sizeは1固定が安全です。
Q2. FLUX.1のVAEは流用できる?
いいえ。FLUX.2は専用VAE(flux2-vae.safetensors)が必要で、流用すると黒一色や色破綻が発生します。
Q3. DistilledとBaseはどう使い分ける?
日常運用はDistilled(4 step・サブ秒)、最終品質を詰めたい本番カットだけBase(20 step)に切り替える二段構えが推奨です。
Q4. マルチリファレンスは何枚まで有効?
最大8枚まで入力でき、strength 0.6〜0.85が安定域です。同一キャラの別アングルを2〜4枚入れるのが基本構成です。