ゲーム制作でのAIの利用（２） – インフィニティー株式会社

前回はChatGPTとStable Diffusion Webuiとの組み合わせで企画書の挿絵を作成したり、テクスチャを拡大しての再利用について書きました。

今回は、少し趣向を変えて、Stable Diffusion webui の img2img 機能でこんなこともできるんだ、という（ゲームから少し離れた）話題について書いてみたいと思います。

まずはこちらの写真をご覧ください。バチカン美術館の天井画の写真です。

この写真を適当なサイズ（1024×768）にリサイズしimg2imgの元絵として設定します。プロンプト他、パラメータは以下の通り、プロンプトは写真とは全く関係の無い内容です。

best quality, hires, beautiful sky, greenery, chibi gril and boy are sitting in the chairs,
Negative prompt: sketches, (worst quality, bad quality, child, cropped:1.4), (bad anatomy), (monochrome), (grayscale), (bad-hands-5:1.0),
Steps: 32, Sampler: DPM++ 2M Karras, CFG scale: 8.5, Seed: 1089170072, Size: 1024×768, Model hash: 5a41e1b35f, Model: epi25dphotogodess_v3, Denoising strength: 0.5, Clip skip: 2

モデルはお好みで（今回はepi25dphotogodess_v3を使用）選んでください。さて生成を実行すると、あら不思議、こんな画像が生成されます。

全体の構図は元絵を意識したものになっていますが、人物はプロンプトに近いものになっていますね。Denoising Strength が 0.5 であるために、元絵とプロンプトの中間を作っているようです。キャラクタの衣装も元絵を意識したようなデザインですね。
さらに Denoising Strength を 0.6 に上げると、なぜこうなったと小一時間問いたくなるような絵が生成されます。

ただ何となく元絵の構図が見て取れますね。プロンプトで指示した chibi ではないし、boy も無視されていますが…。
一般的には Denoising Strength に大きな値を与えると、プロンプトで指定されているものがあちこちにちりばめられると考えられていますが、プロンプトが元絵と全く関係ないと、新たに適当な絵（AIがプロンプトから導き出す絵）を作ってしまうようです。Denoising Strength 0.5 を境に元絵とプロンプトの影響度が変わるので、線形補間が行われているような印象です。まあ、これはこれで面白いですね。

別の天井画からはこんな画像も生成されました。

※ここまでの AI 生成画像は、img2img で元絵と同サイズで画像生成を行った後、生成された絵を元に Denoising Strength 0.4 で 2倍に拡大後、 Photoshop で元のサイズに縮小したものです。

さて、ここでゲーム制作に話題を戻しましょう。
ここまでの AI 生成画像はゲーム制作においてはほとんど利用価値がありません。使用するとなるとどこかの部屋の壁にかかった小さな額に貼る位でしょうか？
しかしながら適切な写真を選び、プロンプトで方向性を適切に与えることでゲームで利用可能な画像を得ることができます。
下の画像は、アテネのパルテノン神殿をゲームの遠景として使用する目的で生成しました。写真からアニメ風のタッチに描き変えるようプロンプトで指示しています。

ゲームで利用するテクスチャを用意する場合、写真から加工することが多いのですが、ゲームテイストがリアル調ではない場合、テクスチャの加工にかなりの時間が割かれてしまいますね。でもAI画像生成を利用することで大幅な時短を実現することができるのです。

※ご注意
こちらで紹介しているAI生成画像の元の写真は、筆者が自らのカメラで撮影したものを使用しております。したがって元画像の著作権は筆者にございます。

スタッフ募集中！

弊社では、現在プログラマ、2DUIデザイン、3Dモデリングのスタッフを募集しています。AIの利用も可能です。
ご関心のある方は、求人募集ページからご応募ください。社員応募だけでなく、フリーランスの方も歓迎いたします。