2026年4月は「ローカル高速生成」と「クラウドAI高精度化」の両軸が同時加速した月。FLUX.2 Klein・Midjourney v8・ChatGPT Images 2.0など7大トピックを実務視点でまとめました。
関連記事: ComfyUIでFLUX.2 Kleinを動かす完全ガイド【2026年4月最新版】
1. FLUX.2 [klein] 4B/9B モデル登場(Black Forest Labs)
2026年1月15日にBlack Forest LabsがリリースしたFLUX.2 [klein]は、FLUXシリーズ最速・最軽量モデルです。
- 4Bモデル: 4ビリオンパラメータ、蒸留版で推論1秒以下を実現
- 9Bモデル: 高品質寄りの標準版、編集ワークフローにも対応
- テキスト→画像と画像編集が1モデルで完結するユニファイドアーキテクチャ
- ライセンス: Apache 2.0(商用利用可)
NVIDIAがFP8量子化対応を提供し、VRAM40%削減・速度40%向上を実現。RTX 4060(8GB)でも快適動作が報告されています。
2. ComfyUI 新機能まとめ:App View・NVFP4対応・AMD ROCm統合
ComfyUIは2026年に入り以下の大型アップデートを投入しました。
| 機能 | 内容 |
|---|---|
| **App View** | ノードグラフ不要の簡易UIモード(ノードビューと切替可) |
| **NVFP4ネイティブ対応** | RTX 50シリーズでVRAM60%削減・速度2.5倍 |
| **FP8対応** | RTX 40シリーズでVRAM40%削減・速度1.7倍 |
| **AMD ROCm統合** | デスクトップアプリにROCmをネイティブ搭載 |
| **Python 3.13対応** | 最新Python環境で安定動作 |
| **Painter ノード追加** | インペイントの自由度が大幅向上 |
特にApp Viewは初心者向けの大きな変化で、プロンプトとパラメータだけで生成できる画面を提供しつつ、上級者はいつでもノードビューへ切り替えられます。
3. Midjourney v8 Alpha 公開(2026年3月)
2026年3月17日にMidjourney v8 Alphaが一般公開されました。
v8の主な改善点
- デフォルト2K HD出力(アップスケール不要)
- 複数被写体プロンプトの精度95%(v7比で大幅向上)
- テキスト描画・空間整合性の強化
- テキスト→動画・画像→動画(最大10秒・60fps)に対応
Niji 7(2026年1月)
アニメ特化モデルNiji 7も同時期にリリース。目・反射・細部の描写精度が向上し、プロンプト追従性が大きく改善されました。
4. ChatGPT Images 2.0 登場(OpenAI・2026年4月21日)
OpenAIがChatGPT Images 2.0を発表。最大の特徴は「Thinking(思考)機能付き画像生成」です。
- Web検索を使いながら画像を生成・検証
- 1プロンプトから複数バリエーションを自動生成
- テキスト描画精度が飛躍的に向上(メニュー・標識など実用レベル)
- 複雑な構図指示への対応力が強化
ただしクラウドAPIのみの提供で、ローカル実行は不可です。
5. T-LoRA:過学習を防ぐ新しいLoRAトレーニング手法(AAAI 2026)
AAAI 2026で発表されたT-LoRA(Timestep-Dependent Low-Rank Adaptation)は、LoRA学習の定番課題「過学習」を解決します。
仕組み
高タイムステップ(大まかな構造形成フェーズ)は過学習しやすいため、タイムステップごとにランクを動的に変化させることで学習を安定化。
効果
- 標準LoRAより概念忠実度・テキスト整合性ともに向上
- 少ないデータ・少ないVRAMで高品質なLoRAが作成可能
- GitHubで公式実装が公開中(Apache 2.0)
6. SD 3.5 ControlNet 3種リリース(Stability AI)
Stability AIがSD 3.5 Large向けのControlNetモデル3種を公開しました。
- Blur: ぼかし参照によるスタイル転写
- Canny: エッジ線から構図を制御
- Depth: 深度マップによる立体構造の保持
8K・16Kの超高解像度アップスケールへの適用が公式サポートされており、印刷物や大判出力用途に特に有効です。
7. Google Gemini 3 Pro Image Preview 登場
Googleも画像生成を強化し、Gemini 3 Pro Image Previewを発表。Gemini APIを通じてテキストと画像の相互変換が可能になり、クラウドAI競争がさらに激化しています。
まとめ
| トピック | 最重要ポイント |
|---|---|
| FLUX.2 Klein | Apache 2.0・4B/9B・ローカル高速生成 |
| ComfyUI | App View・NVFP4・AMD ROCm統合 |
| Midjourney v8 | 2K HD・動画生成・95%精度 |
| ChatGPT Images 2.0 | Thinking機能・テキスト描画強化 |
| T-LoRA | 過学習対策・少データ高品質化 |
| SD 3.5 ControlNet | 3種類・8K/16K対応 |
| Gemini 3 Pro | クラウドAI競争激化 |
2026年4月はローカル勢(FLUX.2 Klein)とクラウド勢(ChatGPT Images 2.0・Gemini 3 Pro)の競争がピークを迎えた時期です。次月以降はFLUX.2向けLoRAや動画生成の品質競争が注目点となるでしょう。
詳細なセットアップ手順は ComfyUIでFLUX.2 Kleinを動かす完全ガイド もご覧ください。
よくある質問(FAQ)
Q. FLUX.2 KleinはFLUX.1と何が違いますか?
A. Klein(4B/9B)はFLUX.1(12B)より軽量・高速で、テキスト→画像と画像編集が1モデルで可能です。ライセンスもApache 2.0で商用利用しやすくなっています。
Q. ComfyUIのApp Viewはどうやって使いますか?
A. ComfyUIを最新版にアップデートすると画面上部にモード切替ボタンが表示されます。App Viewではプロンプトと基本パラメータのみが表示され、Generateボタンを押すだけで動作します。
Q. Midjourney v8は無料で使えますか?
A. 現在Alpha版は既存サブスクライバー向けの限定公開です。正式リリース後も月額サブスクリプションが必要です。
Q. ChatGPT Images 2.0 APIの料金は?
A. OpenAIの最新APIドキュメントを参照してください。画像サイズ・品質によって従量課金となります。
Q. T-LoRAはKohya_ssで使えますか?
A. T-LoRAは公式実装がGitHubで公開されていますが、2026年4月時点ではKohya_ss統合は非公式です。公式リポジトリのREADMEに従って独立環境で実行するのが推奨です。