画像生成AIの勉強を始めました - はらこステーション

連休に入ってから「画像生成AI Stable Diffusionスタートガイド」という本を見ながら画像生成AIの勉強をしています。Apple SiliconとかNVIDIA GPU搭載のパソコンは持っていないので、Google Colaboratory環境でやっています。「LoRA」と呼ばれる手法は環境に問題があるのか動かせていないですが、他はなんとなく動かせました。

一通り動かしてみて、思い通りの画像を生成するのはなかなか大変だと思いました。AIに対する支持は「プロンプト」と呼ばれる英語のテキストで行うのですが、かなり具体的な指示を与えないと意図した画像はできないようです。そこで「プロンプト」を効果的に作成する方法を書いた本がないかAmazonで調べていましたが、ChatGPTにプロンプトを書かせる方法を書いた本がありました。そこで早速試してみました。

AI美女の生成は他の皆さんにお任せするとして今回は先日公開した「アリアドネ」をイメージした画像を生成することに挑戦しました。

「あなたは、プロのコピーライターです。望遠鏡で夜空を覗いている少年というテーマのAI画像を作るときのプロンプトをリサーチしたいので、下記の項目、それぞれに10個ずつの言葉を教えてください」という感じでChatGPT君に考えてもらって作成したプロンプトでドキドキしながら「Generate」を押してみます。

初めて生成したのがコレです。なんとなく雰囲気出ています。でも望遠鏡がないぞ？

次にモデルを変えて生成してみました。なんとなく良さげな感じです。

これもなかなか雰囲気出ています。

モデルを実写系に変えてみました。望遠鏡が変？　トランペットか？

余裕があれば、挿絵みたいな感じで画像生成を続けていこうと思っています。