結論:FLUX.2 LoRAは1024×1024・1500〜2500 steps・LR 1e-4・rank 32〜64が2026年版ベストプラクティスで、SDXLとは推奨設定が大きく異なります。
FLUX 2は写真リアル・準リアル系のLoRA学習で「2026年の唯一の本命」と言える位置にあります。本記事ではSDXLとの設定差を表で整理し、データセット作り・学習率・ステップ数・GPU要件まで実務目線でまとめます。
SDXLとFLUX.2のLoRA学習設定比較
| 項目 | SDXL | FLUX.2 |
|---|---|---|
| アーキテクチャ | Diffusion (UNet) | Flow Matching (DiT) |
| 推奨解像度 | 768×768 | 1024×1024 |
| 学習率 | 1e-4 | 1e-4(実質もう少し低めも可) |
| ステップ数 | 1000〜1500 | 1500〜2500 |
| 推奨rank | 16〜32 | 32〜64(高めが効く) |
| データセット | 15〜25枚 | 20〜30枚 |
| 必要VRAM | 12GB〜 | 16GB〜(Q4で8GB可) |
| トリガー語 | 既知語を流用 | 新規トークン推奨 |
| マルチリファレンス | 不可 | 推論時に最大8枚 |
1. データセット品質が9割を決める
15〜20枚のキュレーション済み画像は、50枚の中途半端なデータセットに常勝します。
- 複数アングル(正面・横・斜め・後ろ)を網羅
- 表情・ポーズ・照明のバリエーション
- 重複に近いカットを排除(同じ角度+同じ衣装は1枚に絞る)
- 解像度は学習解像度の1.5倍以上で用意(後でクロップ可)
「枚数を増やす前に1枚ずつ吟味する」が最強の改善策です。
2. キャプション戦略:FLUX系は自然言語が効く
SDXLは「単語列挙+タグ」が標準でしたが、FLUX.2は自然言語の文章キャプションのほうが効果的です。
- SDXL例:
1girl, orange hair, school uniform, smiling, indoor - FLUX.2例:
A young woman with short orange hair wearing a navy school uniform, smiling softly in a sunlit classroom.
トリガー語は文の先頭に固定し、毎枚必ず入れます。
3. 学習率とスケジューラ
| モデル | LR | スケジューラ | warmup |
|---|---|---|---|
| SDXL | 1e-4 | cosine | 0%〜5% |
| FLUX.2 | 1e-4 | cosine | 5%〜10% |
| FLUX.2 Pro | 8e-5 | cosine | 10% |
過学習を避けるため、save_every_n_steps で200〜400ステップごとにチェックポイント保存し、複数バージョンを比較するのが安全です。
4. rank(dim)とalphaの目安
- SDXL:rank 16/alpha 16(軽量)〜rank 32/alpha 16(標準)
- FLUX.2:rank 32/alpha 32(標準)〜rank 64/alpha 32(重い被写体)
FLUX.2は高rankが効きやすい一方、ファイルサイズが200〜400MBに膨らみます。配布前提ならrank 32で十分です。
5. GPU要件と量子化
| GPU | SDXL LoRA | FLUX.2 LoRA |
|---|---|---|
| RTX 4060 8GB | ◎(標準) | △(Q4必須・遅い) |
| RTX 4070 12GB | ◎ | ○(FP8で可) |
| RTX 4090 24GB | ◎(高速) | ◎(FP8で快適) |
| H100 / A100 | ◎ | ◎(バッチ大可) |
8GB環境ではFLUX.2の学習速度が大きく落ちるため、SDXL LoRAで素材を作り、FLUX.2はマルチリファレンス推論で代替する戦略も有効です。
6. FLUX.2 Proのマルチリファレンスとの併用
FLUX.2 Proは推論時に最大8枚の参照画像を取り込めます。LoRAが中程度の精度でも、参照画像と組み合わせれば商用レベルの一貫性が出ます。
- LoRA:被写体の基礎構造・特徴を担当
- マルチリファレンス:衣装・小物・微細表情を担当
「LoRAは70点でいい、残り30点は参照で詰める」設計が2026年の最適解です。
まとめ:2026年のLoRA学習方針
1. データセット20〜30枚を全力でキュレーション
2. FLUX.2は1500〜2500 steps、LR 1e-4、rank 32〜64
3. SDXL資産は捨てず、FLUX.2と用途で分ける
4. VRAMが厳しいならQ4量子化+マルチリファレンスで補う
5. 配布前は必ず3〜5枚のチェックポイントを比較
FLUX.2は学習コストは高いものの、出力品質と一貫性で頭ひとつ抜けています。本格運用するならRTX 4070以上+FP8、ライト運用ならSDXL LoRAを継続、というハイブリッドが現実的です。
関連記事
- [ComfyUIでFLUX.2 Klein 4Bを動かす完全ガイド](https://ikuriblog.com/flux2-klein-comfyui-setup-guide/)
- [AI画像生成 最新ニュース7選【2026年5月】](https://ikuriblog.com/ai-image-generation-news-may-2026/)
よくある質問(FAQ)
Q1. FLUX.2 LoRA学習は何枚の画像から始めればいい?
20〜30枚のキュレーション済み画像が現実的な最小値です。50枚の中途半端な画像より15〜20枚の厳選画像のほうが結果が良くなる傾向があります。
Q2. FLUX.2とSDXLの学習設定の最大の違いは?
アーキテクチャ(Flow MatchingとDiffusion)の違いから、FLUX.2はステップ数が多く(1500〜2500)、推奨rankが高め(32〜64)です。キャプションも自然言語が効果的です。
Q3. RTX 4060 8GBでFLUX.2 LoRAは学習できる?
Q4 GGUF量子化を使えば可能ですが学習が遅く、batch_sizeも制約されます。8GB環境ならSDXL LoRAを継続し、FLUX.2はマルチリファレンス推論で代替する戦略が有効です。
Q4. LoRAとマルチリファレンスはどちらを優先?
併用が最強です。LoRAで被写体の基礎構造を学習し、マルチリファレンスで衣装・小物・微細表情を補完する設計が2026年の最適解です。
Q5. 過学習を避けるベストプラクティスは?
save_every_n_stepsで200〜400ステップごとにチェックポイントを保存し、複数バージョンを比較してください。学習率1e-4、cosineスケジューラ、warmup 5〜10%が安定域です。