Stable Diffusion で VRChat の友達のAI画像を作成してプレゼントしましたが、やってみると VRChat とAI画像は相性が良いことに気づきました。
気に入った作品を作るのは時間がかかりますが、お金はかからずに心のこもったプレゼントができるので、VRChat などの友達にAI画像をプレゼントするのは凄くオススメです!
- VRChat ができるマシンであれば概ね AI画像生成(Stable Diffusion)が動作可能
- VRChat のアバターは可愛い女性が多いが、AI画像も可愛い女性のモデルデータが多い
- VRChat のアバターをモデルにすると、LoRA学習が比較的簡単
作成の経緯
ちょっと前の日記「【Party Report】2023.07.29 Happy Birthday TRICO @ Trico’s」で、Trico ちゃんの誕生日にAIアートを送ったことを少し書きましたが、きっかけは7月の頭に Discord で Juborky から突然来た個別メッセージでした。
もうすぐ Trico の誕生日。Trico のサプライズアートショーケースにぜひご参加ください!
アートテーマ=Trico / Trico の動画配信
あなたも私と同じで絵を描くことができない場合は、imagine.art や nightcafe.studio などの無料の AI アート ジェネレーターの使用を検討してください。
あなたのトリコアートを7/30までにJuborkyまたはAikaに送ってください。
そして覚えておいてください…これはサプライズなのでトリコの前では言わないでください。
※ この後、7/14になって期限が7/22に前倒しされ、お尻に火が付きました!笑
おおお!「誕生日にサプライズで絵を送ろう!」だなんて、なんて素敵なアイデアなんだ!
わかった!
絵を描くのが苦手なのでAIアートに挑戦してみます!
画像生成AIは一度やってみたかったので、二つ返事で作ることにしました!
作成環境
AIで画像生成するには何のグラフィックボードを搭載しているかが重要なようです。
自分の環境は VRChat ではかなり低スペックの GTX1660Ti(VRAM 6GB)を使ってますが、今回やりたかったAI画像レベルの作成であれば、なんとか大丈夫でした!
種類 | 内容 | |
---|---|---|
CPU | Core i5-6500 | |
グラフィックボード | GeForce GTX1660Ti | |
メモリ | 32GB | |
OS | Windows 10 pro |
いろんなグラフィックボードで Stable Diffusion で画像生成可否と生成時間をまとめて頂いている以下のページが非常に参考になります。
Stable Diffusion を動かすには、最低で GTX1660Ti くらいのグラフィックボードが必要そうでした。
画像生成AI作成ツール検討
最初にいくつか画像生成AIについて調べてみましたが、PCを持っているのであれば「Stable Diffusion」一択という感じでした。
画像生成AIができるWebサービス
Imagine AI Art Generator
費用:無料?
概要:Webで画像生成AIが使える模様。日本語の説明サイトは見つからず。このサイト(Imagine.art - top AI tools)の動画がわかりやすい。
補足:おそらくフリーだと思うが、回数制限などがあるか不明。また、日本語の説明サイトが無いので大変そう。
🤖 🖼 AI Art Generator: Create Stunning AI Art - NightCafe Creator
費用:無料枠あり。5クレジット/日、100クレジット/$5/月~
概要:Webで画像生成AIが使える模様。日本語の説明サイトは見つからず。以下のサイトが公式の説明サイト。
A Step by Step Guide on how to Create AI Art on NightCafe Studio – NightCafe Creator
補足:無料枠は1日5つまで。日本語の説明サイトが無いので大変そう。
Midjourney
費用:有料のみ。無料枠は25回まで。200枚/$10/月~
概要:Discord でメッセージを送ると絵を作って表示してくれる。日本語の説明サイトは検索するといっぱい出てくる。
補足:過去は無料版があったようですが、2023年4月に終了したそうです。
PCにインストールして画像生成AIができるソフト
GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
費用:PCにインストールすれば回数制限無しで無料。PCが無い場合でも無償の Google Colaboratory というサービスを利用することで無料で使える。
概要:呪文(プロンプト)と呼ばれるテキストを入力すると画像を作成してくれる。LoRAという付加ツールで自分で学習させることもできる。
補足:検索するとインストールから画像生成、学習など日本語のサイトが大量に出てくるので、これが主流だとわかる。オープンソースなのでいろんな付加ツールもある。
画像生成AIを試しにちょっと触ってみたいという程度であればインストールが不要なWebサービスが楽ですが、何か具体的に描きたいモデルや背景やポーズがあって、それを無料で作りたい場合は「Stable Diffusion」一択という状況のようです。
Stable Diffusion WebUI インストール
Stable Diffusion WebUI のインストールについては画像をいっぱい貼った別の記事で記載しましたので、こちらをご参照ください。
【Stable Diffusion WebUI】イチからインストールした詳細な画面ログや補足情報
Stable Diffusion WebUI のインストール記事はいろいろありますが、画面イメージが少ないためいろんなサイトで確認しながら進めることになり結構時間がかかりました。参考のため、自分が Windows 10 にインストールした時の画面イメージや補足を載せておきます。
Trico ちゃんの画像生成
画像の左側が VRDJ Trico ちゃん、右側の妹の AIKA ちゃんも VRDJ です。
そもそも画像生成AIでどんな絵を作れるのかも全然わからない状況だったので、一番最初に試した「【2023年】美少女AIコスプレイヤーをStable Diffusionで生成する方法についてまとめていく!【ChilloutMix】 | 悠々ログ」の「【例3】ヘッドフォン女子」のプロンプトを変更して近づけれるか試してみました。
ネガティブプロンプトはそのままでプロンプトを少しづつ変えながら、黒髪、キャップやDJ、ターンテーブルなどを記載してみて何度も作成。DJしてるっぽい女性はできるけど、なかなか調整は難しいとわかりました。
ちなみにこの時点ではダウンロードしてるモデルデータは chilled_remix_v2 のみです。
LoRA作成
この頃は Stable Diffusion のいろいろな記事を見てたので、描きたい画像に近づけるために LoRA と呼ばれる追加学習があることを知ってました。
具体的には以下の記事や動画を見て Kohya's GUI という LoRA 作成ツールをインストールして、Trico ちゃんの LoRA を作成してみました。
- 【Stable Difussion Web UI】自分でLoRAデータを作成!「kohya_ss GUI」を使って学習環境を構築する方法!
- 【Stable Diffusion】簡単に自作LoRAを生成できる「Kohya’s GUI」の導入方法と使い方を紹介!
- 【有料級】簡単!最後までできる!kohya’GUIを使ったLora作成!【Stable Diffusion】 【Lora学習】
正直、あまり上手くいかなかったのもあり、インストールや作成についてはここでは省略します。気になる方は上記の記事などを見て試してみてください。
自分はとりあえず Trico ちゃんの discord などから20画像を選んで 700x700 のPNGファイルにして LoRA を作成。
LoRA だけで画像生成してみると、、え!?だれ?子供!?
結局、プロンプトをいろいろ調整するけど、LoRA は全然効果が感じれないので上手く学習できてない模様。。もう一度 LoRA 学習しても行けそうな気がしない。。ちょっと手詰まり感。。
LoRA だけで画像生成、効果がわからない。。
プロンプトの調整で少し近づくが LoRA は効いてなさそう
ターンテーブルとか部屋とかイマイチ近づけれない、手詰まり感
いろいろなモデルデータを試す
違うモデルデータだとどうなるんだろう?といろいろダウンロードして試してみました。
今回、作成した画像を売ったり、何かのサービスに使ったりはしないですが、作者のクレジット表示が必要なモデルは大変なので避けました。
参考 | モデル | 著作権NG | |
---|---|---|---|
chilled_remix | - | ||
StingerMix | - | ||
Kawaii Realistic European Mix | No selling models | ||
Beautiful Realistic Asians | No selling models No generation services No Civitai generation | ||
Ether Blu Mix | No selling models | ||
Yuzu | No selling models | ||
Cetus-Mix | No selling models No generation services No Civitai generation No selling images |
しかも、いろいろなモデルデータを探しててDJで検索するとDJのLoRAデータが登録されていることに気づきました!
参考 | LoRA | 著作権NG | |
---|---|---|---|
DJ electronic music | No sharing merges No selling models No generation services No Civitai generation No selling images |
他のモデルを試して Yuzu、Cetus-Mix がいい感じだなと思ったが、DJ の LoRA を適用したとたん、一気に完成度が上がった!おおお、ちゃんと学習させた LoRA は効果絶大だ!!
img2img を使った背景や構図の調整
概ね完成ではあるけど、大きな会場で大勢の前でDJをしている絵にしたいなぁと考えてたところ、img2img という機能が使えそうでしたので試してみました。
DJの写真をネットで検索して、巨大な会場で大勢の前でDJしていて、花火とか上がってる写真を適当に見つけて、img2img のベースにしてみました。
最初は無茶苦茶になったんですが、途中ちょっといい感じの画像ができて、それをベースにまたいろいろ作るという感じで、だんだん同じような画像が大量に生成されて、もうどれでも充分という感じになってきました。笑
完成
これまで 512 x 512 で作成してたので、アップスケールで 2048x2048 にして、GIMPなどで jpg に変換して完成です。
ちなみにモデルデータは Yuzu です。
LoRA や img2img を使ってるので同じ画像は生成できないですが、プロンプトも置いておきます。
さいごに
画像生成AIで初めて作った作品でやった内容について記載してみました。
インストールなど面倒ではありましたが、グラフィックボードが搭載されてるPCを持っていれば、無料で簡単に高画質の画像を生成することがわかりました。
VRChat などのお友達にオリジナルのAI画像を作って送るのはオススメです。
著作権は気を付けてくださいね。
コメント