Stable Diffusionのインストール記事を書いたのが23年5月5日なので、画像生成を初めて約1年経ちました。(執筆は24年5月)
今までいろいろな拡張機能を試してきましたが、実際に使用しているものはそこまで多くありません。
今回は約1年画像生成をして、現役で使用しているおすすめの拡張機能を8つご紹介します。
本当に便利な拡張機能8選
Easy Prompt Selector
Easy Prompt Selectorは、登録したプロンプトをWebUI上で呼び出すことができる拡張機能です。
特定のカテゴリ内にあるプロンプトをランダムで呼び出したり、設定を保存して切り替えたりもできます。
自分でリストを作ることもできるので、「よく使うけど覚えてない」みたいなプロンプトを登録しておけば、調べたり探したりする手間が省けて時短になります。
代用できる他の拡張機能などもありますが、見やすさ・操作性・利便性などを総合的に考えると、プロンプト補助系では一番使いやすと思います。
Civitai Helper
Civitai Helperは、CivitaiにあるモデルやLoRAの管理ができる拡張機能です。
モデルの最新バージョンをチェックしたり、サムネイルを自動で設定したりできます。
CivitaiのLoRAを使うときはクリックでトリガーワードを入力したり、WebUIからモデルのページに飛んだりも可能。
ほぼサムネ取得かモデルのページに飛ぶくらいの使い方しかしてませんが、ないと不便な拡張機能なので、なんだかんだずっと使用しています。
ControlNet
ControlNetは、画像から何らかの情報を抽出して、新しい画像を生成できる拡張機能です。
ただ機能によっては画像を取り込まなくても動かせますし、インペイントで画像修正なども行えるので、正直何でもできる拡張機能という印象。
特定の画像と同じポーズにしたいとか、線画から画像を生成したいとか、やりたいことがあったらControlNetさえあれば大体できる気がします。
どんな画像を生成したいかにもよりますが、とりあえず入れといて損はありません。
SDWebUI Forgeだと標準搭載されているので、それくらいWeb UIには欠かせない拡張機能です。
Dynamic Prompts
Dynamic Promptsは、プロンプトをランダムで入力できる拡張機能です。
例えば髪色を黒・茶色・金色のいずれかにしたいとき、1つずつ書き換えて生成するのは手間がかかります。
Dynamic Promptsを使うと、{black|brown|blond} hairと書くだけで、{}内のプロンプトを1つだけランダムで採用。
また{}内に{}も使えるので、例えばアングルを複数指定したいときは以下のように書くこともできます。
{from {side|front|below|above}|POV|Aerial|dutch angle}
他にも{}内から2個採用したり、Combinatorial generationで{}内を順番に採用したり、ワイルドカードを使ったりなど、本当に使い方次第で幅広い画像生成が可能です。
最初に生成したい内容を決めておけばほったらかしで多様な画像生成ができるので、私個人としてはControlNetの次くらいに重宝しています。
Lama Cleaner
Lama Cleanerは、Web UIでもスタンドアローンでも使える画像修正ツールです。
画像の不要な部分を削除して、周囲の環境と一致するよう自動で補完してくれます。
画像を取り込んで削除したい箇所にマスクを塗るだけなので、操作も簡単。
画像にもよりますが、ちょっとした部分を削除・修正するだけならインペイントよりこっちの方が処理も速いです。
ADetailer
ADetailerは、生成後の画像を自動で修正してくれるツールです。
生成後の画像から顔・手・体などを検出して修正が可能。
細かくパラメータも調整できるので、自分好みの画像を仕上げることができます。
以下の画像は左がADetailer未使用、右が使用したものです。
通常顔が小さい画像は崩れてしまいがちですが、ADetailerを使用することでこのように修正ができます。
hires.fix使わずにこのクオリティなので、とりあえずONにしとくだけでも十分効果があります。
3D・2D画像によって対応モデルが違うので、詳細はこちらの記事を確認してください。
TrainTrain
TrainTrainはSDWebUI上でLoRAが作れる拡張機能です。
画像やキャプションデータは別途用意する必要がありますが、学習自体はパスやパラーメータを指定するだけで簡単にできます。
他のツールだとインストール方法が複雑だったり、設定が多かったりして少しハードルが高いのですが、TrainTrainは初心者の方でも簡単に使うことが可能。
逆にこだわりたい人はLoRAの階層やパラメータを細かく調整できるので、幅広い方に対応したLoRA作成ツールとなっています。
dataset-tag-editor
dataset-tag-editorは、画像からキャプションデータを抽出・追加・削除ができるツールです。
キャプションデータはLoRA学習に使用するもので、学習して欲しい要素などを調整できます。
画像1枚に対してテキストファイルを1つ使用するので、手動だと1つ1つ修正する必要があり、それだと少し手間です。
dataset-tag-editorを使うと、キャプションデータを一括で修正してテキストファイルを作成できるので、作業効率化に繋がります。
LoRA学習をしたい方は、TrainTrainと合わせて入れておくのがおすすめです。
Stable Diffusionの本当に便利な拡張機能8選まとめ
今回は本当に便利な拡張機能8選ということで、現役で使っている拡張機能を紹介しました。
生成したい画像によって必要な拡張機能は異なりますが、今回紹介したのは作業効率化や利便性が向上できるものです。
画像生成全般に関わるものが多く、入れておいて損はない拡張機能なので、興味があればぜひ使ってみてください。