AIイラスト生成ツールStable Diffusionであのゲームの景色も描ける


アイキャッチ画像

ここ数ヶ月、AIによるイラスト生成技術を用いたツールがSNS上で話題になっており、GitHub Copilotなどで有名なOpenAI社のイラスト生成AI「DALL·E 2」は大きな波紋を生んだ。

そして先日、世界最高峰の人工知能を実装したイラスト生成ソフトウェア「Stable Diffusion」が公開された。
「Stable Diffusion」は以前のサービスにも増して高精度・高品質なのはもちろんのこと、限りなく機能制限がない形で利用できるという利点がある。

Webサービスとしても提供

これまでのイラスト生成ツールはDiscord上で動作するBotやウェブサービスでの提供だったが、無料版では枚数制限や画質制限といった成約が多くあるサービスが多かった。
しかし、「Stable Diffusion」は各自利用者がパソコンやサーバー上動作・ホスティングする形式で、システムリソースの浪費を考慮しないで良いことも制限の少ない理由の一つではないかと言われている。

有志が「Stable Diffusion(stable-diffution-v1-4)」を無料でWebサービスとして公開。誰でも簡単にAIのイラスト生成を体験できるようになった。

Gakyo Automatic Atelier
https://gakyo-3d71a.web.app/

因みに、Stable Diffusionの開発元・Stability AI社が開発・運営する画像生成AIサービス「Dream Studio」も公開されており、そちらはより詳しく・高精度な設定も可能なので試す用途からワンステップしたい場合はこちらをおすすめする。

とにかく詳細に指示するのがコツ

それでは早速試してみよう。まず手始めに「初音ミクのような少女」を描いてもらってみた。
指示テキストは「a girl like Hatsune Miku looking back at us」。USという主観的表現があるにも関わらず、後ろ向きの構図で顔だけ振り向いている人物が出力され、「初音ミク」感もうまく表現できていた。

次に構図や画のスタイルなど他の利用者を見習い、とにかく細かく指示を送ってみた。

指示テキストは「a scene of the movie of dragon jumping out of volcano」(ドラゴンが火山から飛び出すシーン)。
翼の生えたドラゴンが火山から飛び出しているという文が理解できている。

イラスト風の画像生成以外にも、「a scene of the movie of a 3d rendered image of ~」のように、3Dレンダリングを下かのような画像を生成してほしいといった指示にも対応し、現存するフィギュアのような画像が生成される。

ゼルダやマリオカートの世界も

また、オリジナルな画像以外にも、固有のゲームタイトルや漫画作品風の画像も生成してくれる。

以下画像は「a full-length photo of A view from The Legend of Zelda: Breath of the Wild」という指示を行い、『ゼルダの伝説 ブレス オブ ザ ワイルド』のような景色を生成してみた。

全体的に”ブレワイぽい”画像が生成され、右下にはリンクのような人物が出力された。
水彩画のような画風かつ、こどもリンクなので少し違和感は感じるが正確に意図は汲み取れている印象だ。

次は「a scene of graphic novel of Mario running through the Mario Kart stage on a motorcycle」(マリオカートのステージをバイクで駆け抜けるマリオ)で挑戦。

“バイクで”という指示はあまり反映されていないものの、マリオカートでよく見る道路とダート・背景の建物はしっかり生成できている。
マリオの再現度に圧倒され、記事として取り上げてよいか迷うほどの出来で驚いた。

ライセンスはどうなのか

これまで簡単に試してみたのだが、これらの生成された画像の著作権・ライセンスはどうなるのか。「Stable Diffusion」によると以下のライセンスに則って取り扱ってほしいとの記載が。

stable-diffution-v1-4のモデルは、CreativeML Open RAIL-M ライセンスでライセンスされており、生成物は完全にあなたに属し、それを共有する場合は責任を負う
しかし、法律に違反するコンテンツを共有したり、人に危害を加えたり、危害を意図した個人情報を流布したり、誤った情報を広めたり、脆弱なグループをターゲットにしたりすることを禁止している。
出典:https://huggingface.co/spaces/CompVis/stable-diffusion-license

「マリオカートのような画像を生成して」という指示に対して得られた画像の著作権は自分に帰属するとは言え、上記のように誰が見ても「マリオである」というような画像が生成された場合はどのような対応を取るべきかといった問題はあるのではないかと感じた。