当ブログにはプロモーション、アフィリエイト広告が含まれます。

【Stable Diffusion】AIグラビアの作り方は?使用モデルやレシピを紹介!

XではAIグラビアというハッシュタグで、画像を投稿している方が多数存在します。

非常にクオリティが高いため、具体的なレシピが知りたい!という方も多いのではないでしょうか?

ある程度使用モデルやLoRA、サンプラー、プロンプトなどは出回っており、それらに自分の好みの要素を加えれば簡単にハイクオリティな画像が生成できます。

今回はAIグラビアの具体的な生成方法について、ご紹介します。

Stable Diffusion Web UIのインストールはこちら

AIグラビアとは?

名前の通りAIで作成したグラビアアイドルや綺麗な女性のことです。

グラビアは本来雑誌などの写真ページのこと指し、そのページの被写体になる女性をグラビアアイドルと呼びます。

Xでは以下のようにハイクオリティな画像が毎日投稿されています。

今回はこのような画像を生成するためのモデルやLoRA、プロンプトなどをご紹介します。

AIグラビアの作り方

AIグラビアによく使用されているモデル

商用利用可の中でよく使用されているモデルをご紹介します。

Beautiful Realistic Asians(BRA)

Beautiful Realistic Asians - v6.0 | Stable Diffusion Checkpoint | Civitai
Im currently preparing and collecting dataset for SDXL, Its gonna be huge and a monumental task. I wanna thank everyone ...

BRAは商用利用可のモデルとしてよく挙げられるもので、クラウドソーシングで画像生成系の募集を見ると、BRAを指定しているクライアントが多く存在します。

ただし、BRAはバージョンによって使いやすさが異なり、アジア人に特化しているため若干人を選ぶかもしれません。

BracingEvoMix

BracingEvoMixはBRAとchilled_remixの作者さんが話し合って作った低リスクモデルです。

アジア特化というわけでもないため、BRAより幅広い人物が生成可能。

またプロンプトが非常に効きやすく、指定した要素を再現しやすいです。

sazyou-roukaku/BracingEvoMix · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

chilled_remix

完全にリアルというわけではなく、2.5次元っぽい画像が生成できるモデルです。

chill系の中ではおそらく一番有名であり、ゲームの素材や広告にも使われていることがあります。

sazyou-roukaku/chilled_remix · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

またchilled_remix系列でいうと、majicMIX realisticやkisaragi_mixもあります。

majicMIX realistic

majicMIX realistic 麦橘写实 - BETTER v2 = v2.5 | Stable Diffusion Checkpoint | Civitai
ImgCreator.AI ranks top 3 in realistic photo generators, also No.1 in anime generator and powerful AI canvas editor. Try...

kisaragi_mix

kisaragi_mix - v2.2 | Stable Diffusion Checkpoint | Civitai
リアル系マージモデルです。日本人を始めとするアジア系の再現ができるように調整しています。特にjapanese doll likenessとの親和性を意識しています。 このマージモデルを公開するにあたり、使用したモデルの製作者の皆様に感謝申し...

モデルに関しては好みもあるので、実際に使ってみて良いと感じたものを利用してみてください。

各リンクからデータをダウンロードして、以下のパスに移動させれば使えるようになります。

stable-diffusion-webui\models\Stable-diffusion

AIグラビアでよく使用されているLoRA

上記のモデルとよく一緒に使用されるLoRAは、「doll-likeness」シリーズです。

LoRA配布ページ

Kanbara/doll-likeness-series at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

リアルなアジア人の女性を生成したいときによく使われるもので、上記のモデルと組み合わせるとハイクオリティな画像が生成できます。

以下はBRA6とJapaneseDollLikeness、KoreanDollLikenessの組み合わせや重さを変えて生成した画像です。

特徴として、KoreanDollLikenessは重みを上げると髪型がセンター分け、胸が大きくなることがあります。

また、上記の画像はLoRAの特徴を表現するため重みを0.7と高めに設定していますが、これだと他のプロンプトが効きにくくなってしまう可能性もあります。

単体でも組み合わせる場合でも0.2~0.6くらいで、合計値を1以下にするのがおすすめです。

結果を見ながら重さやプロンプトを調整してみてください。

なお、LoRAはダウンロードしたデータを以下のパスに移動させれば使えるようになります。

stable-diffusion-webui\models\Lora

LoRAの使い方につていはこちらの記事も参考にしてみてください。

AIグラビアでよく使用されているembeddings

embeddingsはLoRAと似たように、モデルに対して学習したデータを適応させられるものです。

ネガティブプロンプトで使用できるものが多く、低画質や描写崩れなどを防ぐ効果があります。

個人的におすすめなのはeasynegativeとbadhandv4です。

easynegative:https://civitai.com/models/7808/easynegative
badhandv4:https://civitai.com/models/16993?modelVersionId=20068

easynegativeは短いプロンプトでさまざまなネガティブ要素を除外してくれるもの、badhandv4は手の崩れを防いでくれるものです。

以下のパスに入れれば使えるようになります。

stable-diffusion-webui\embeddings

ネガティブプロンプトについてはこちらの記事でも解説しているので、参考にしてみてください。

ControlNetのtileでより高画質に

ControlNetのtileというプリプロセッサを使えば、生成時に高画質化することができます。

titleは若干独特な質感が出るため好みは分かれますが、Amazon Kindleなどの写真集で使用している方も多いです。

導入方法を全部説明すると長くなってしまうので、必要なもののインストール方法のみご紹介します。

まずStable Diffusion Web UIを開き、Extensions→Install from URL→URL for extension's git repositoryに以下のURLを入力してインストールしてください。

https://github.com/Mikubill/sd-webui-controlnet.git

続いてtileのプリプロセッサをダウンロードします。

下記リンクから「control_v11f1e_sd15_tile.pth」をダウンロードしてください。

lllyasviel/ControlNet-v1-1 at main

ダウンロードしたファイルは以下のパスに移動します。

stable-diffusion-webui\models\ControlNet

これでAUTOMATI1111を再起動すれば、ControlNetでtileが使えるようになります。

txt2imgにControlNetが追加されているので、画像生成時に以下のように設定します。

Enable:チェック
Low VRAM(VRAM8GB以下ならチェック推奨)
Pixel Perfect:チェック
Control Type:チェック
[Loopback]~:チェック

Loopbackを使っているため、画像を取り込む必要はありません。

ControlNetを使わない時は「Enable」のチェックを外してください。

その他詳しい使い方についてはこちらの記事をご確認下さい。

AIグラビアの画像サイズ

AIグラビアに限らず、画像サイズが大きいとそれなりに高画質でハイクオリティな画像が生成できます。

ただ多くのモデルが512×512などの画像サイズで学習しているため、最初から1080×1920など大きいサイズを指定すると画像が崩れてしまうことが多いです。

ですので、一般的にはhires.fixなどでアップスケールするのをおすすめします。

最終的な画像サイズを1080×1920にしたいのであれば、540×960を2倍、432×768を2.5倍など。

サイズが大きくなると処理も重くなるので、PCスペックとも相談してみてください。

AIグラビア生成時のパラメータ

ここではサンプラーやhires.fixで使用するアップスケーラーなどの設定についてご紹介します。

あくまでよく見る設定なので、再現したい特徴などがハッキリしている場合は、自身で調整してみてください。

Sampling methodDPM++ 2M Karras
Sampling steps20~30
UpscalerR-ESRGAN 4x+
Denoising strength0.5~0.6
VAEvae-ft-mse-840000-ema-pruned.safetensors
Clip skip2

Clip skipはモデルにもよりますが、どのモデルも大体2を推奨しています。

またDenoising strengthは値が高いと画像が崩れてしまうため注意が必要です。

AIグラビアの具体的なレシピ

上記で紹介したモデルやLoRAなどを使って、実際に生成した画像とパラメータをご紹介します。

服装・背景・髪型などはランダムでそれ以外はほぼ固定です。

BRA5

1girl, solo. (8k, RAW photo, highest quality, masterpiece),(realistic, photo realism:1. 37), BREAK,
<lora:JapaneseDollLikeness_v15:0.5>, <lora:koreanDollLikeness_v20:0.2>, BREAK,
(business suit:1.2), staff room, BREAK,
(cowboyshot:1.2), (short hair:1.1), black hair, smile, Side angle
Negative prompt: EasyNegative, badhandv4, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), paintings, sketches, nsfw
Steps: 23, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 2894254194, Size: 480x640, Model hash: ac68270450, Model: beautifulRealistic_brav5, VAE hash: 735e4c3a44, VAE: vae-ft-mse-840000-ema-pruned.safetensors, Denoising strength: 0.55, Clip skip: 2, ControlNet 0: "Module: tile_resample, Model: control_v11f1e_sd15_tile [a371b31b], Weight: 1, Resize Mode: Crop and Resize, Low Vram: True, Threshold A: 1, Guidance Start: 0, Guidance End: 1, Pixel Perfect: True, Control Mode: Balanced, Save Detected Map: True", Hires upscale: 2, Hires upscaler: R-ESRGAN 4x+, Lora hashes: "JapaneseDollLikeness_v15: 50b3f6a2ecf7, koreanDollLikeness_v20: 8f3d16e6eada", TI hashes: "easynegative: c74b4e810b03, badhandv4: 5e40d722fc3d, easynegative: c74b4e810b03, badhandv4: 5e40d722fc3d", Version: v1.6.1

BracingEvoMix

1girl, solo. (8k, RAW photo, highest quality, masterpiece),(realistic, photo realism:1. 37), BREAK,
<lora:JapaneseDollLikeness_v15:0.5>, <lora:koreanDollLikeness_v20:0.2>, BREAK,
(business suit:1.2), office, BREAK,
(cowboyshot:1.2), (braid:1.1), brown hair, serious, panorama shot, Kneeling
Negative prompt: EasyNegative, badhandv4, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), paintings, sketches, nsfw
Steps: 23, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 3295497555, Size: 480x640, Model hash: 5bc5a45624, Model: BracingEvoMix_v1, VAE hash: 735e4c3a44, VAE: vae-ft-mse-840000-ema-pruned.safetensors, Denoising strength: 0.55, Clip skip: 2, ControlNet 0: "Module: tile_resample, Model: control_v11f1e_sd15_tile [a371b31b], Weight: 1, Resize Mode: Crop and Resize, Low Vram: True, Threshold A: 1, Guidance Start: 0, Guidance End: 1, Pixel Perfect: True, Control Mode: Balanced, Save Detected Map: True", Hires upscale: 2, Hires upscaler: R-ESRGAN 4x+, Lora hashes: "JapaneseDollLikeness_v15: 50b3f6a2ecf7, koreanDollLikeness_v20: 8f3d16e6eada", TI hashes: "easynegative: c74b4e810b03, badhandv4: 5e40d722fc3d, easynegative: c74b4e810b03, badhandv4: 5e40d722fc3d", Version: v1.6.1

chilled_remix

1girl, solo. (8k, RAW photo, highest quality, masterpiece),(realistic, photo realism:1. 37), BREAK,
<lora:JapaneseDollLikeness_v15:0.5>, <lora:koreanDollLikeness_v20:0.2>, BREAK,
swimsuit, schoolyard, BREAK,
(cowboyshot:1.2), (low ponytail:1.1), black hair, grin, Angle from below, sleepingposture
Negative prompt: EasyNegative, badhandv4, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), paintings, sketches, nsfw
Steps: 23, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 3117747645, Size: 480x640, Model hash: 48c4cec131, Model: chilled_remix_v2, VAE hash: 735e4c3a44, VAE: vae-ft-mse-840000-ema-pruned.safetensors, Denoising strength: 0.55, Clip skip: 2, ControlNet 0: "Module: tile_resample, Model: control_v11f1e_sd15_tile [a371b31b], Weight: 1, Resize Mode: Crop and Resize, Low Vram: True, Threshold A: 1, Guidance Start: 0, Guidance End: 1, Pixel Perfect: True, Control Mode: Balanced, Save Detected Map: True", Hires upscale: 2, Hires upscaler: R-ESRGAN 4x+, Lora hashes: "JapaneseDollLikeness_v15: 50b3f6a2ecf7, koreanDollLikeness_v20: 8f3d16e6eada", TI hashes: "easynegative: c74b4e810b03, badhandv4: 5e40d722fc3d, easynegative: c74b4e810b03, badhandv4: 5e40d722fc3d", Version: v1.6.1

kisaragiMix

((8k, RAW photo, highest quality, masterpiece),High detail RAW color photo professional photo,(realistic, photo realism:1. 37), (highest quality),ultra high resolution,highly detailed CG unified 8K wallpapers, physics-based rendering,cinematic lighting),sharp-focus, insanely photorealistic, ray traced reflections,BREAK,1girl, <lora:JapaneseDollLikeness_v15:0.2>, <lora:koreanDollLikeness:0.2>, (stting:1.2), (above thigh:1.3), (medium hair:1.2), (black hair:1.2), smile, (cooking, apron, T-shirt and jeans:1.2)
Negative prompt: EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)),paintings, sketches,bad anatomy,facing away lowres,bad anatomy,bad hands, text, error, missing fingers,extra digit, fewer digits, blurry,bad feet,extra fingers,fused fingers,too many fingers,long neck,mutated hands,bad body,bad fingers,missing fingers,nsfw
Steps: 25, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1844042272, Size: 360x640, Model hash: ac68270450, Model: beautifulRealistic_brav5, Denoising strength: 0.55, Clip skip: 2, Hires upscale: 2, Hires upscaler: ESRGAN_4x, Lora hashes: "JapaneseDollLikeness_v15: 50b3f6a2ecf7, koreanDollLikeness: 8f3d16e6eada", TI hashes: "easynegative: c74b4e810b03", Version: v1.5.1

majicmixRealistic

1girl, solo. (8k, RAW photo, highest quality, masterpiece),(realistic, photo realism:1. 37), BREAK,
<lora:JapaneseDollLikeness_v15:0.5>, <lora:koreanDollLikeness_v20:0.2>, BREAK,
hooded sweatshirt, restaurant, BREAK,
(cowboyshot:1.2), (two side up:1.2), brown hair, smirk, feet out of frame, onallfours
Negative prompt: EasyNegative, badhandv4, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), paintings, sketches, nsfw
Steps: 23, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 3649042540, Size: 480x640, Model hash: e4a30e4607, Model: majicmixRealistic_v6, VAE hash: 735e4c3a44, VAE: vae-ft-mse-840000-ema-pruned.safetensors, Denoising strength: 0.6, Clip skip: 2, Hires upscale: 2, Hires upscaler: R-ESRGAN 4x+, Lora hashes: "JapaneseDollLikeness_v15: 50b3f6a2ecf7, koreanDollLikeness_v20: 8f3d16e6eada", Version: v1.6.1

PCスペックが低いので480x640の2倍で生成していますが、もう少し大きくできればクオリティも上げられると思います。

またLoRAの重みや種類を変えると、異なる人物や質感も再現可能です。

入力しても反映されていないプロンプトがあるので、ここらへんは再現したい内容に応じて調整してみてください。

AIグラビアの作り方まとめ

今回はAIグラビアの作り方についてご紹介しました。

まとめ
  • AIグラビアのモデルは大体決まってる
  • アジア人のLoRAは「doll-likeness」シリーズが有名
  • embeddingsを入れると劣化などが防げる
  • tileを使うと質感が変わるけど高画質化ができる
  • サイズを大きくするとクオリティも上がる

今回紹介したのはあくまで一例になりますが、ただモデルを使って生成する画像よりは高いクオリティで生成できます。

服装や表情、ポーズなどは自由に変えられるので、いろいろ試行錯誤して理想の画像を生成してみてください。

Stable Diffusion Web UI
スポンサーリンク
イクリ

Stable Diffusionを使った画像生成AIの情報をメインに発信しています。
以前多ジャンルで運営していましたが、全ジャンルに同じ熱量を注ぐのが難しく分割しました。
AI以外のジャンルはnoteでゆるく運営してます。

イクリをフォローする
イクリをフォローする

コメント

タイトルとURLをコピーしました