画像生成AI「Stable Diffusion」のテキスト・呪文作成のポイントとおすすめ単語を紹介！

「Stable Diffusion」にどんなテキストを入れればいいの？
「Stable Diffusion」で絵を描きたいけど、思い通りの絵にならない

こんな悩みを解決します！！

画像生成AI「Stable Diffusion」を利用していますか？

画像生成AI「Stable Diffusion」では「プロンプト」や「呪文」と呼ばれるテキストを入れるだけで、AIが簡単に絵を描いてくれます。

でも、英語でテキストを入れる必要があるし、どんなテキストを入れればいいか悩んでいる方が多いかと思います。

本記事では、「Stable Diffusion」のテキスト、呪文を作成するときのポイントとおすすめ単語を紹介します。

Stable Diffusionとは無償で使える画像生成AIのこと

「Stable Diffusion」とは、AI企業「Stability.Ai」が開発したオープンソースの画像生成AIのことです。

使い方は下記記事で紹介しているので、参考にしてください。。

: 簡単！画像生成AI「Stable Diffusion」の使い方をわかりやすく解説！
画像生成AI「Stable Diffusion」のデモの使い方や、Google Colabでの使い方をわかりやすく解説します。

「Stable Diffusion」のデモ

「Stable Diffusion」はデモページが用意されています。

今回はこのデモサイトで試していきます。

デモページ

テキスト作成時のポイント

単語は75個以内にする

「Stable Diffusion」に入れるテキストの文章は長すぎるのはNGです。

ざっくりいうと、75個以上の単語（トークン）は切り捨てられてしまいます。

詳細は下記を参照してください。

単語数を調べる方法なども紹介されているので、とても参考になります。

絵に影響しない文字は入れない

区切りで使用するカンマ「 , 」や　冠詞「 a 」「 the 」などは絵に対する影響がないので、削除しても大丈夫なようです。

また、カンマなどは１つの単語（トークン）として認識されてしまいます。

そのため、認識させる単語を75個以内にするためにカンマなどの絵に影響しない文字は入れないようにしましょう。

先頭の単語の影響が大きくなる

生成される絵に対して、単語の順番も重要になります。

テキストの先頭の単語のほうが、絵に対する影響が大きくなります。

大事な要素は先頭のほうに記入するようにしましょう。

画家・アーティスト名を入れる

画家・アーティスト名を入れると、画像のテイストを合わせてくれます。

アーティスト名があると、生成される絵のクオリティが高くなります。

参考となるイラストが明確なほうが、ＡＩが絵を生成しやすいのだと思います。

気に入った画像が生成されるまであきらめない

「Stable Diffusion」では乱数を使用して、ランダムに画像が生成されます。

そのため、理想通りの画像が生成されたり、造形が変な画像が生成されたりします。

気に入った画像が生成されるまであきらめずに、同じテキストで何度も試しましょう。

テキストで使える単語集

テキストの基本構成

「Stable Diffusion」に入力するテキストの基本構成は以下のようになります。

【画像のジャンル】　＋　【メインの被写体】　＋　【被写体の状態】　＋　【画像のクオリティ】　＋　【画像のスタイル】

【画像のジャンル】　：　実写やアニメ絵、油絵、鉛筆絵といった、画像全体のジャンル・コンセプトを記入します。

【メインの被写体】　：　人物や動物、風景といった内容を記入します。

【被写体の状態】　　：　被写体がどういったものかなどの詳細も記入します。

【画像のクオリティ】　　　：　画像の色合いなどのクオリティも記入します。

【画像のスタイル】　：　参考画像やアーティスト名を記入します。

実際に利用しやすい単語を紹介していきます。

画像のジャンル

「単語　＋　of 」と記入すると、画像のジャンルを指定できます。

concept art　：　コンセプトアート
Portrait　：　ポートレート
key visual　：　キービジュアル
illustration　：　イラスト
animation　：　アニメーション
japanese anime　：　日本のアニメ
Anime key visual　：　アニメ風
digital painting　：　CG画
CG　：CG画
logo　：　ロゴ
icon　：　アイコン
pictogram　：　ピクトグラム
hieroglyph　：　ヒエログリフ、聖刻文字。古代エジプトで使われた3種のエジプト文字のうちの1つ
Hieratic　：　ヒエラティック、神官文字。古代エジプトで使われた3種のエジプト文字のうちの1つ
photo　：　写真
oil paining　：油絵
pencil drawing　：　鉛筆画
pottery　：　陶芸
sculpture　：　彫刻
bronze statue　：　銅像
Cartoon　：　漫画

メインの被写体

メインの被写体は生成したい対象を明確に記入しましょう。

女性を描きたい場合は「girl」、熊を描きたい場合は「bear」、森の風景画を描きたい場合は「forest」といった風に素直に記入すればOKです。

日本語の文章を翻訳サイトで翻訳して入れるだけでもよいと思います。

被写体の状態

イメージしている被写体の状態を明確に記入しましょう。

人物の画像では下記のような単語が便利です。

detailed　"体の部位"　：　体の部位を詳細にする
full body　：　全身
closeup　：　顔のアップ
kawaii　：　かわいい画像が生成されます

画像のクオリティ

画像全体の質を指定することができます。

RGB　：　カラー
color　：　カラー
monotone　：　白黒
digital painting　：　CG
sharp focus　：　くっきり
highly detailed　：　詳細を描画
8K　：　８K
ray tracing　：　光があたる感じ

画像のスタイル

「 art by　”画家・アーティスト名” 」　と記入することで、実在の画家・アーティストの作風に似せることができます。

複数の画家・アーティストを記入すると、組み合わせた作風にすることができます。

「 art by　”アニメ・漫画” 」と記入すると、アニメ・漫画に似せることができます。

人物のおすすめ

Alphonse Mucha
Artgerm
WLOP
Krenz Cuchart
Amano yoshitaka
Tom Bagshaw

風景画のおすすめ

Darek Zabrocki
Greg Rutkowski
Craig Mullins

また、特定のサイトのトレンドに合わせることも可能です。

trending on artstation　：　ArtStationのトレンドに合わせる
trending on pixiv　：　pixivのトレンドに合わせる

テキスト作成で参考になるサイト

テキスト作成する際に、参考になるサイトを紹介します。

どんな単語でどんな画像ができるか、よりイメージしやすくなります。

また、短い文章から、「Stable Diffusion」に入力するのに適した文章を生成してくれるサイトもあります。

希望通りの文章にならない場合もありますが、テキスト作成の参考になりますので、ぜひ試してみてください。

MagicPrompt　Stable Diffusion Prompt Generator

テキスト記入例

女性絵のテキスト例

女性の絵を描くためのテキスト例を紹介します。

テキストには細かく記入していませんが、いい感じの絵が生成されています。

下記テキストに詳細を追加してくと、かわいい女性の絵を作ることができるので、試してください。

Anime key visual kawaii girl highly detailed 8K art by Alphonse Mucha Artgerm Tom Bagshaw

まとめ

本記事では、「Stable Diffusion」のテキスト、呪文を作成するときのポイントとおすすめ単語を紹介しました。

イラストを全然描けない人でも簡単に素敵な画像を生成することができるので、ぜひ試してください。

最後まで読んでいただきありがとうございます！

ご意見、ご感想があれば、コメントを頂けるとうれしいです！！