2024/03/24 Stable Diffusion XL に対応できるように修正しました。
- 最近、「Stable Diffusion」って聞くけど、何ができるの?
- 「Stable Diffusion」に興味があるけど、使い方がわからないよ
- 「Stable Diffusion」を使うには、高性能なPCが必要なの?
こんな悩みを解決します!!
最近、画像生成AIが流行ってきましたね!
「Stable Diffusion」「Midjourney」「DALL・E2」などでてきました。
最新のAI技術、体験したくないですか?
こんな画像が簡単に生成することができます。
本記事では、「Stable Diffusion」のデモの使い方や、Google Colaboratory(以下Google Colab)での使い方をわかりやすく解説します。
この記事を読めば、初心者でも「Stable Diffusion」を使った画像生成を体験することができます。
Stable Diffusionとは無償で使える画像生成AIのこと
「Stable Diffusion」とは、AI企業「Stability.Ai」が開発したオープンソースの画像生成AIのことです。
2022年8月23日から無償公開されていて、誰でも使用することができます。生成された画像は商業利用も可能です。
Stable Diffusion(Stability.Ai)
Stable Diffusionはバージョン1、バージョン2と公開され、現在(2024年3月)ではStable Diffusion XLとSDXL Turboが公開されています。
Stable DiffusionのモデルはHugging Face、GitHubに公開されています。
Stable Diffusionに関するドキュメントは下記で見ることができます。
自分のPCで使用するには、NVIDIA製GPUが推奨されていますが、デモページを使用すれば、簡単に試すことができます。
また、Google Colabでも使用することができます。
Stable Diffusion 2.1 デモページの紹介
デモの使い方
Stable Diffusionはデモページが用意されていて、簡単に試すことができます。
無料で試せる、Stable Diffusion 2.1のデモページの使用方法を解説します。
まずはデモページにアクセスしましょう。
テキストボックスに英語でテキストを入力して「Generate image」を押すことで、画像を生成できます。
「Enter your prompt」には、Stable Diffusionへの指示(プロンプト)を入力します。
例えば、人物や動物、背景など、どんな画像を生成したいか、どのような要素を入れたいかを詳しく記入します。
「Enter a negative prompt」には、画像生成時に除外したい要素を入力します。
ネガティブプロンプトを使用することで、画像の品質低下を防いだり、不要な要素をなくしたりすることができます。
例えば、家の画像から窓をなくしたい場合には、ネガティブプロンプトに「windows」と入力します。
処理が混んでいると、エラーが表示されますが、何度か実行をクリックすれば、画像生成が始まります。
画像生成には少し時間がかかりますので、どんな画像が出来上がるかワクワクしながら待ちましょう!
画像生成例
どんなテキストを入力すればいいかわからない場合は、テキスト例が載っていますので、参考にしてみましょう。
- A high tech solarpunk utopia in the Amazon rainforest
- A pikachu fine dining with a view to the Eiffel Tower
- A mecha robot in a favela in expressionist style
- an insect robot preparing a delicious meal
- A small cabin on top of a snowy mountain in the style of Disney, artstation
「A high tech solarpunk utopia in the Amazon rainforest」で画像生成すると次の画像が生成されます。
Stable DiffusionをGoogle Colabで使う方法
「Stable Diffusion」はGoogle Colabで試すこともできます。
性能のいいPCを自分で用意するよりも、簡単に試すことができますので、おすすめです。
Google Colabについては、こちらの記事で解説しています。
⇒【Google Colabの使い方】Pythonを手軽に始められる開発環境を解説!
「Stable Diffusion」を試すためのコードはHugging FaceとGitHubに公開されています。
今回はStable Diffusion XLをGoogle Colabで実行する方法を紹介します。
stabilityai/stable-diffusion-xl-base-1.0(Hugging Face)
Google ColabのGPU設定
Stable Diffusion XLをGoogle Colabで実行する準備をしましょう。
まずは、Google ColabでGPUを使用するための設定をします。
Google Colabのメニュー「編集」から「ノートブックの設定」クリックします。
「ハードウェア アクセラレータ」を「GPU」に変更して、保存します。
Stable Diffusion XLのインストール
続いて、Stable Diffusionをインストールします。
# Stable Diffusionのインストール
pip install diffusers --upgrade
# 関連ライブラリのインストール
pip install invisible_watermark transformers accelerate safetensors
Stable Diffusionを実行するための準備をします。
少し時間がかかるので、処理が完了するまで待ちましょう。
# Stable Diffusionの準備
# インポート
from diffusers import DiffusionPipeline
import torch
# パイプライン
pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", torch_dtype=torch.float16, use_safetensors=True, variant="fp16")
pipe.to("cuda")
以上で、「Stable Diffusion」をGoogle Colabで実行する準備が完了しました。
画像生成の実行
「Stable Diffusion」をGoogle Colabで実行していきましょう!
下記コードの ”テキスト” に生成したい画像のテキストを入力します。
# 画像の生成
# 生成したい画像のテキストを記入
prompt = "テキスト"
# 生成
image = pipe(prompt=prompt).images
# 画像の保存
# ファイル名は自由に設定してください
image.save("test.png")
処理が完了すると、画像が保存されているので、確認しましょう。
画像は左のフォルダのマークをクリックし、保存したファイル名をクリックします。
以上で、「Stable Diffusion」をGoogle Colabで実行できました。
Google Colabを無料で使用している場合、GPUで何度も画像生成すると、使用制限に引っかかることがあります。
使用制限の解除時間は正確にはわかりませんが、1日程度で解除されるイメージです。
【旧記事】Stable Diffusion version 1をGoogle Colabでの使う方法
Stable Diffusion version 1のコードがうまく動かなくなったので、2024年3月に本記事内容を修正しました。
今は必要ないですが、Hugging Faceへの登録方法などが何かの役に立つかもしれないので、旧記事内容を残しています。
Q&A
Stable Diffusionとは何ですか?
Stable Diffusionとは、AI企業「Stability.Ai」が開発したオープンソースの画像生成AIのことです。入力されたテキスト(プロンプト)から高品質な画像を生成することができます。
Stable Diffusionの使用に特別なハードウェアが必要ですか?
自分のPCで使用するには、NVIDIA製GPUが推奨されていますが、デモページを使用すれば、簡単に試すことができます。
また、Google Colabでも使用することができます。
Stable Diffusionの使い方のコツは?
以下の点に注意すると、より良い画像を生成しやすくなります。
- プロンプトを具体的に入力する
- 複数回生成して、気に入った画像を選ぶ
まとめ
本記事では、「Stable Diffusion」のデモの使い方や、Google Colaboratory(以下Google Colab)での使い方をわかりやすく解説しました。
生成した画像が確認できたと思いますが、希望通りの画像になっていましたか?
意外と簡単にできたかと思います。
いろんなテキストで試して、画像生成AI「Stable Diffusion」を楽しみましょう!!
テキストの生成については、下記記事を参考にしてください。
Pythonを効率的に学習するために
Pythonの学習方法は、書籍やyoutube、スクールなどがありますが、一番のおすすめはオンラインスクールでの学習です。
オンラインスクールを勧める理由は以下の通り。
- 学習カリキュラムが整っているので、体系的に学ぶことができる。
- 時間や場所を選ばずに、自分のペースで学習できる。
- 学習で詰まったときに、気軽に質問できる環境がある。
オンラインスクールについてはコチラの記事で紹介しています。
⇒ これで決まり!Pythonオンラインスクール おすすめ3社を厳選!
2024年10月1日から給付制度が拡充され、最大80%給付されるスクールもあります。
Python学習を効率的に進めるために、スクールの検討をしてみてください。
おすすめオンラインスクール
コスト重視:デイトラ
AIスキル重視:Aidemy PREMIUM
転職重視:キカガク
最後まで読んでいただきありがとうございます!
ご意見、ご感想があれば、コメントを頂けるとうれしいです!!