超高精度なイラスト生成AI「NovelAI」の背後にある無断転載サイト”Danbooru”の存在
昨日10月3日に超ハイクオリティな二次元イラストを生成してくれるサービス「NovelAI」がTwitterのトレンドにも上がるほどの話題になった。アニメ作品などで登場するキャラクターの名前を入れるだけで非常に似たイラストが高解像度高精度で生成さている。
Since we are training on Danbooru, it also learns character names and their visuals. You can prompt for "masterpiece portrait of smiling rem, re zero, caustics, textile shading, high resolution illustration" and get this: pic.twitter.com/2wqDmAxCJa
— NovelAI (@novelaiofficial) September 25, 2022
もっとも、今年の夏に入ってから「Stable Diffusion」などのAIを用いた画像生成技術を用いたソフトウェアやサービスが数多く登場し、技術の進歩に驚かされる日々である。
無断転載サイト問題
しかし単に驚かされるばかりではなく、しばしば権利問題がTwitter を中心に SNS上で多く議論されていることが見受けられ、直近だと日本の会社が作ったイラスト生成サービス「mimic」 が大きく話題に上がっていた。
「Novel AI」のイラスト生成ではStable Diffusionのモデルをベースに追加でトレーニングさせたモデルを用いている。モデル訓練用の画像データのソースの一つにdanbooruから収集した画像を用いていると説明し、これが一連の話題を生む原因の一つになった。
“booru”とは画像掲示板の英語圏の俗称であり、日本で言うとふたばちゃんねるのようなサービス。その画像掲示板「danbooru」はpixivやTwitterと言ったサービスから無断転載を行い画像を投稿する特徴がある。サイトのWhoisを見てみるとアメリカで2005年にドメインが登録されている。
これらの画像を訓練用データとして用いるのが著作権的にアウトではないかという意見が多く寄せられている。ちなみに同サイトでは膨大なイラストか設置されているだけでなく、コンテンツやキャラクター別に細かくタグ付けがなされていた。
この一連の話題は今回の「NovelAI」が登場する以前から多く議論されていた話で、Twitter上では「時間の問題であり海外による高品質な AIサービスの登場は避けられない」といった声もmimicの際には議論されていた。加えて、「有料課金を行わないと画像生成をすることができない」といった部分も批判を加速させている理由の一つであると見て取れる。
一方で、これまで数多く登場してきた画像生成AI の訓練用データにこれらの無断転載された画像が使われてないかと言えばそういうわけでもないという声も上がっている。
・StableDiffusion…LAION 5B にDanbooruの画像URLがある
・WaifuDiffusion…Danbooru 2021 データセット使用を明言
・NovelAI…Danbooru利用を明言。
・ミッドジャーニー…WaifuLabsとコラボしてSafebooru由来のデータを使う(予定)つまりみんなDanbooru使ってるやん! となります
— 草 (@MutedGrass) October 3, 2022
画像生成を行うことに注力したトレーニング済みのモデルはCC-BY 4.0で配布されていることも多く、開発者すら意図せずに利用してしまうこともありうる。
これらの一連の問題に関し、日本国内だけで対処可能な問題ではなく、これ以上「無断転載を使用するな」と言った制御は厳しいのではないかという意見が多く見受けられている。