生成AI Bardでイメージを生成してみた【たまプラビジネス余談放談】20240220
この記事を参考に、実際にイメージを生成したみたのでその過程を公開する。
gigazine.netBardへのリンクはこれ。
生成目標は、帽子を被った中年男性のイメージ画像。
なお、文章は英語で入力する必要がある。
1 最初はシンプルな条件で
Generate a image of skin head middle aged man wearing a hat.
しかし、これは、”Skin head”の部分が特定個人を傷つける可能性があり、 Googleの利用規約に抵触するというので受付されず。そこで、その部分を削除して、Generate a image of skin head middle aged man wearing a hat. すると受け付けられて生成が始まった。受け付けられた場合は、Sure, here is a image~とメッセージが表示されて、しばらく待つと画像が表示されてくる。この時のイメージは、色黒の中年男性がテンガロンハットを被ったイメージだった。背景などを指定しなかったのでぼかしが入っている。しかし高画質。
2 次は、1の画像にメガネをかけたものを依頼
Generate a image of skin head middle aged man wearing glass and a hat.
しかし最初はBardがビジーなので後でもう一度トライとメッセージ。少し待って再度依頼。すると、もっと詳しく書けと返信。理由も、ステレオタイプな画像を作ることを避けるためと、クリエイターのようにしっかりしている。具体的には、
どんな帽子なのか?キャップか、麦わら帽子か?
どんなメガネか?例えば色とか形は?
男性の雰囲気はどんなか?紳士か、思慮深い感じか、など
他になにか特徴的な条件はあるか?
などの条件を明確化せよとのことだ。
3 そこで、条件を明確化。
Generate a image of middle aged man is wearing a black frame glass and a hat. His hat is a kind of knit cap, sitting in an office, and his expression is rather thoughtful.
黒いフレームのメガネ、ニットのキャップ、オフィスにいて、思慮深い印象
という条件で具体化した。そこで生成されたのが下記の画像。かなり良くできている。
ブログに掲載する本文にマッチした挿絵的な画像イメージを生成することにも使えそう。いろいろ試していこう。