【Stable Diffusion】VRChat などの友達にAI画像のプレゼントはオススメ！

Stable Diffusion で VRChat の友達のAI画像を作成してプレゼントしましたが、やってみると VRChat とAI画像は相性が良いことに気づきました。

気に入った作品を作るのは時間がかかりますが、お金はかからずに心のこもったプレゼントができるので、VRChat などの友達にAI画像をプレゼントするのは凄くオススメです！

VRChat ができるマシンであれば概ね AI画像生成(Stable Diffusion)が動作可能
VRChat のアバターは可愛い女性が多いが、AI画像も可愛い女性のモデルデータが多い
VRChat のアバターをモデルにすると、LoRA学習が比較的簡単

作成の経緯
作成環境
画像生成AI作成ツール検討
1. 画像生成AIができるWebサービス
2. PCにインストールして画像生成AIができるソフト
Stable Diffusion WebUI インストール
Trico ちゃんの画像生成
LoRA作成
いろいろなモデルデータを試す
img2img を使った背景や構図の調整
完成
さいごに

作成の経緯

ちょっと前の日記「【Party Report】2023.07.29 Happy Birthday TRICO @ Trico’s」で、Trico ちゃんの誕生日にAIアートを送ったことを少し書きましたが、きっかけは7月の頭に Discord で Juborky から突然来た個別メッセージでした。

Juborky

もうすぐ Trico の誕生日。Trico のサプライズアートショーケースにぜひご参加ください！
　アートテーマ＝Trico / Trico の動画配信
あなたも私と同じで絵を描くことができない場合は、imagine.art や nightcafe.studio などの無料の AI アートジェネレーターの使用を検討してください。
あなたのトリコアートを7/30までにJuborkyまたはAikaに送ってください。
そして覚えておいてください…これはサプライズなのでトリコの前では言わないでください。

※ この後、7/14になって期限が7/22に前倒しされ、お尻に火が付きました！笑

おおお！「誕生日にサプライズで絵を送ろう！」だなんて、なんて素敵なアイデアなんだ！

cuz

わかった！
絵を描くのが苦手なのでAIアートに挑戦してみます！

画像生成AIは一度やってみたかったので、二つ返事で作ることにしました！

作成環境

AIで画像生成するには何のグラフィックボードを搭載しているかが重要なようです。
自分の環境は VRChat ではかなり低スペックの GTX1660Ti（VRAM 6GB）を使ってますが、今回やりたかったAI画像レベルの作成であれば、なんとか大丈夫でした！

	種類	内容
	CPU	Core i5-6500
	グラフィックボード	GeForce GTX1660Ti
	メモリ	32GB
	OS	Windows 10 pro

いろんなグラフィックボードで Stable Diffusion で画像生成可否と生成時間をまとめて頂いている以下のページが非常に参考になります。
Stable Diffusion を動かすには、最低で GTX1660Ti くらいのグラフィックボードが必要そうでした。

【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】 | ちもろぐ (chimolog.co)

画像生成AI作成ツール検討

最初にいくつか画像生成AIについて調べてみましたが、PCを持っているのであれば「Stable Diffusion」一択という感じでした。

画像生成AIができるWebサービス

Imagine AI Art Generator
費用：無料？
概要：Webで画像生成AIが使える模様。日本語の説明サイトは見つからず。このサイト(Imagine.art - top AI tools)の動画がわかりやすい。
補足：おそらくフリーだと思うが、回数制限などがあるか不明。また、日本語の説明サイトが無いので大変そう。

🤖 🖼 AI Art Generator: Create Stunning AI Art - NightCafe Creator
費用：無料枠あり。5クレジット/日、100クレジット/＄5/月～
概要：Webで画像生成AIが使える模様。日本語の説明サイトは見つからず。以下のサイトが公式の説明サイト。
A Step by Step Guide on how to Create AI Art on NightCafe Studio – NightCafe Creator
補足：無料枠は1日5つまで。日本語の説明サイトが無いので大変そう。

Midjourney
費用：有料のみ。無料枠は25回まで。200枚/＄10/月～
概要：Discord でメッセージを送ると絵を作って表示してくれる。日本語の説明サイトは検索するといっぱい出てくる。
補足：過去は無料版があったようですが、2023年4月に終了したそうです。

PCにインストールして画像生成AIができるソフト

GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
費用：PCにインストールすれば回数制限無しで無料。PCが無い場合でも無償の Google Colaboratory というサービスを利用することで無料で使える。
概要：呪文（プロンプト）と呼ばれるテキストを入力すると画像を作成してくれる。LoRAという付加ツールで自分で学習させることもできる。
補足：検索するとインストールから画像生成、学習など日本語のサイトが大量に出てくるので、これが主流だとわかる。オープンソースなのでいろんな付加ツールもある。

画像生成AIを試しにちょっと触ってみたいという程度であればインストールが不要なWebサービスが楽ですが、何か具体的に描きたいモデルや背景やポーズがあって、それを無料で作りたい場合は「Stable Diffusion」一択という状況のようです。

Stable Diffusion WebUI インストール

Stable Diffusion WebUI のインストールについては画像をいっぱい貼った別の記事で記載しましたので、こちらをご参照ください。

【Stable Diffusion WebUI】イチからインストールした詳細な画面ログや補足情報
Stable Diffusion WebUI のインストール記事はいろいろありますが、画面イメージが少ないためいろんなサイトで確認しながら進めることになり結構時間がかかりました。参考のため、自分が Windows 10 にインストールした時の画面イメージや補足を載せておきます。

Trico ちゃんの画像生成

画像の左側が VRDJ Trico ちゃん、右側の妹の AIKA ちゃんも VRDJ です。

そもそも画像生成AIでどんな絵を作れるのかも全然わからない状況だったので、一番最初に試した「【2023年】美少女AIコスプレイヤーをStable Diffusionで生成する方法についてまとめていく！【ChilloutMix】 | 悠々ログ」の「【例３】ヘッドフォン女子」のプロンプトを変更して近づけれるか試してみました。

ネガティブプロンプトはそのままでプロンプトを少しづつ変えながら、黒髪、キャップやDJ、ターンテーブルなどを記載してみて何度も作成。DJしてるっぽい女性はできるけど、なかなか調整は難しいとわかりました。

ちなみにこの時点ではダウンロードしてるモデルデータは chilled_remix_v2 のみです。

Prompt

masterpiece, best quality,ultra high res,(photo realistic:1.4),1 girl,big black eyes,black hair, (headphones:1.4), DJ, (turn table:1.4), dark concert hall, black baseball cap,black hoodie,full body, (ulzzang-6500-v1.1:1.0), woman,cute, seductive smile, lustrous skin

Negative prompt

EasyNegative, (worst quality:2),(low quality:2),(normal quality:2), lowers, normal quality,((monochrome)),((grayscale)),skin spots, acnes, skin blemishes, age spot, nsfw, ugly face, fat, missing fingers, extra fingers, extra arms, extra legs, watermark, text, error, blurry, jpeg artifacts, cropped, bad anatomy

LoRA作成

この頃は Stable Diffusion のいろいろな記事を見てたので、描きたい画像に近づけるために LoRA と呼ばれる追加学習があることを知ってました。

具体的には以下の記事や動画を見て Kohya's GUI という LoRA 作成ツールをインストールして、Trico ちゃんの LoRA を作成してみました。

正直、あまり上手くいかなかったのもあり、インストールや作成についてはここでは省略します。気になる方は上記の記事などを見て試してみてください。

自分はとりあえず Trico ちゃんの discord などから20画像を選んで 700x700 のPNGファイルにして LoRA を作成。

LoRA だけで画像生成してみると、、え！？だれ？子供！？

結局、プロンプトをいろいろ調整するけど、LoRA は全然効果が感じれないので上手く学習できてない模様。。もう一度 LoRA 学習しても行けそうな気がしない。。ちょっと手詰まり感。。

LoRA だけで画像生成、効果がわからない。。

プロンプトの調整で少し近づくが LoRA は効いてなさそう

ターンテーブルとか部屋とかイマイチ近づけれない、手詰まり感

いろいろなモデルデータを試す

違うモデルデータだとどうなるんだろう？といろいろダウンロードして試してみました。
今回、作成した画像を売ったり、何かのサービスに使ったりはしないですが、作者のクレジット表示が必要なモデルは大変なので避けました。

	参考	モデル	著作権NG
		chilled_remix	-
		StingerMix	-
		Kawaii Realistic European Mix	No selling models
		Beautiful Realistic Asians	No selling models No generation services No Civitai generation
		Ether Blu Mix	No selling models
		Yuzu	No selling models
		Cetus-Mix	No selling models No generation services No Civitai generation No selling images

しかも、いろいろなモデルデータを探しててDJで検索するとDJのLoRAデータが登録されていることに気づきました！

	参考	LoRA	著作権NG
		DJ electronic music	No sharing merges No selling models No generation services No Civitai generation No selling images

他のモデルを試して Yuzu、Cetus-Mix がいい感じだなと思ったが、DJ の LoRA を適用したとたん、一気に完成度が上がった！おおお、ちゃんと学習させた LoRA は効果絶大だ！！

img2img を使った背景や構図の調整

概ね完成ではあるけど、大きな会場で大勢の前でDJをしている絵にしたいなぁと考えてたところ、img2img という機能が使えそうでしたので試してみました。

画像を元にAIイラストを生成するimg2img【Stable Diffusionの基本的な使い方】

DJの写真をネットで検索して、巨大な会場で大勢の前でDJしていて、花火とか上がってる写真を適当に見つけて、img2img のベースにしてみました。

最初は無茶苦茶になったんですが、途中ちょっといい感じの画像ができて、それをベースにまたいろいろ作るという感じで、だんだん同じような画像が大量に生成されて、もうどれでも充分という感じになってきました。笑

完成

これまで 512 x 512 で作成してたので、アップスケールで 2048x2048 にして、GIMPなどで jpg に変換して完成です。

高画質化のやり方 / Stable Diffusion

ちなみにモデルデータは Yuzu です。

LoRA や img2img を使ってるので同じ画像は生成できないですが、プロンプトも置いておきます。

Prompt

<lora:5_djtrico:1>, <lora:DJ:1>, djtrico, near future, concert hall, nike, (nike black baseball cap:1), headphones, turn table, DJ, passionate, woman, japanese, slender, seductive smile, looking at viewer, big black eyes, black hair, bangs, hair between eyes, cowboy shot, nike black sports bra, black pants, crop top, long sleeves

Negative prompt

EasyNegative2, (worst quality:2),(low quality:2),(normal quality:2), lowers, normal quality,((monochrome)),((grayscale)),skin spots, acnes, skin blemishes, age spot, nsfw, ugly face, missing fingers, extra fingers, extra arms, extra legs, watermark, text, error, blurry, jpeg artifacts, cropped, bad anatomy

others

Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1631419011, Size: 512x512, Model hash: bdda7b9930, Model: yuzu_v11, Denoising strength: 0.7, Lora hashes: "5_djtrico: 17f9cd2d125a, DJ: 86236f2cfe68", Version: v1.4.1

Postprocess upscale by: 4, Postprocess upscaler: R-ESRGAN 4x+, Postprocess upscaler 2: SwinIR 4x

さいごに

画像生成AIで初めて作った作品でやった内容について記載してみました。

インストールなど面倒ではありましたが、グラフィックボードが搭載されてるPCを持っていれば、無料で簡単に高画質の画像を生成することがわかりました。

VRChat などのお友達にオリジナルのAI画像を作って送るのはオススメです。
著作権は気を付けてくださいね。