takashi kono's blog

コーヒーとキーボードと共に何かを記録していくブログ

2023-04-27 現在 最も簡単に Stable Diffusion Web UI を楽しむ方法かも Google Colab 編

目的

Stabule Diffusion Web UI をさくっと使う

環境とか必要なもの

Stable Diffusion とは

画像生成AI です
詳しいことは調べてください

全体像

  1. Github から sd-1click-colab をダウンロードする
  2. ダウロードした zip ファイルを展開する
  3. Google Drive に展開した zip ファイルをアップロードする
  4. 利用したいモデルのファイルを選んでダブルクリックして実行する
  5. Google Colab で GPU を利用する設定を入れる
  6. プログラムを実行する
  7. 出てきた URL にアクセスする
  8. 自由に画像を生成しましょう

Github から sd-1click-colab をダウンロードする

ブラウザで以下のページを開く

github.com

Code のプルダウンをクリックして

code

Download ZIP からファイルをダウンロード

download zip

任意の場所にダウンロードしましょう
とりあえず、ダウンロードフォルダでいいと思います

download file

sd-1click-colab-main.zip を展開する

ダウンロードしたら展開します
ダウンロードフォルダにある sd-1click-colab-main.zip ファイルを右クリックしてすべて展開をクリックしてください

extract zip

展開場所は自動で入力されていると思うのでそのままでよいです
展開をクリックして展開します

extract

展開できたら自動で展開場所が開きます

extracted

Google Drive に展開した zip ファイルをアップロードする

任意の開き方でよいですので Google Drive を開きます
以下をクリックしても開きます
(Google Chrome だけかも?)

drive.google.com

画像生成AI ようにフォルダを作っても構いません。もちろん作らなくてもよいです

先ほど展開した sd-1click-colab-mainドラッグアンドドロップして Google Drive にアップロードしましょう

upload

150個以上のファイルがアップロードされますので待ちます

waiting upload

完了したらこうなる

upload successful

フォルダもあることがわかる

uploaded

中身を見る
フォルダをダブルクリックして中身を見る

ipynb files

ipynb という拡張子を持ったファイルが大量にあることがわかる

これ、どれでも全部 Stable Diffusion Web UI が動きます
で、選んだものによって出来上がりに差が出ます
いろいろ使ってみましょう

利用したいモデルのファイルを選んでダブルクリックして実行する

とりあえず、左上にあった yiffymix.ipynb をダブルクリックします
とはいえ、何でもいいです

first app

実行して以下の画面が出た場合

it was not able to preview

その他のアプリを接続をクリック

other app

Marketplace が表示されます

marketplace

アプリを検索で colab と入力して Enter をおします

search result

すると Colaboratory というアプリケーションが検索結果に出ます
クリックしてください

colab

このような画面が出るので、インストールをクリック

ready to install

続行をクリック

select account

アカウントを選択する

connected app +

すると、接続済みのアプリが増えていることがわかる
Google Colabratory をクリックする

view 1

このような画面が新しいタブで開く

Google Colab で GPU を利用する設定を入れる

編集 > ノートブックの設定 をクリックして設定を開く

ノートブックの設定を開く

以下のように ハードウェアアクセラレータ が GPU であれば OK
すでになっていたなら、キャンセル
なっていなかったら GPU を選択して保存して閉じる

gpu

プログラムを実行する

その前に少し説明

ipynb ファイルは3段構成になっていることが多い(この手順に存在するファイルの場合)

その場合、

  1. Web UI を作るために必要なものをそろえたりしている
  2. 必要な道具はそろったので、「1」の出力は消していいよとコメント
  3. 本番を動かそう

となっています

今回の場合
step 1
ちょっと大きかったので枠に入りきらなかったです

step1

step 2
最初のセルをとめて、出力をクリアしてください
と書いてます

step 2

step 3
実行

step 3

の3つのパートに分かれていることがわかります

というわけで実行する

最初のセルを実行する
再生マークを押して実行する

run 1

ものによりますが、ここだけで 10 分程度待つことがあります

progress

今どこを実行しているか?の進捗状況はこの▶を見ればわかります
URL が出力されるまで待ちます

step 1 finish

ここポイントです
プログラムの実行中は、左上の矢印のところのアイコンがくるくる回っているのですが、これ、このままだとタイムアウトまで永遠に回っています
なので、この四角で囲んだ部分にあるような URL が出力されたら OK です

左上の■ぼたんを押してプログラムを停止します

stop

stop したら Interrupted とか出ますが、それでよいです

stopped

Step 2 のうち、 Stop the first cell はすでにプログラムを止めたので完了しています
コード出力は右クリックで消すことができます
(ただ、やらなくてもいいです)

clear cell

もしやるなら、プログラムの出力部分(赤く囲んだ部分)で右クリックして出力を消去しましょう

cleared

出力が消えたことがわかります

step 3 web ui を起動するプログラムを実行

run step 3

また、このアイコンを押して実行
待ちます

step 3 success

URL がまた出力されました
これで Stable Diffusion Web UI の準備ができました
これでこのステップは終わりです

出てきた URL にアクセスする

Running on public URL と書かれている URL をクリックしましょう
新しいタブで Stable Diffusion Web UI が開きます

web ui

こんな感じ

自由に画像を生成しましょう

プロンプトは英語です
ChatGPT などを使って英語を作ってもいいでしょうw

説明

とりあえず、プロンプト、ネガティブプロンプト(オプション)、生成 が分かれば使えます

以上です。

所感

意外と長くなってしまった
簡単ではないかもしれない
ごめんなさい

てすと

「オープンテラスのカフェでアイスコーヒーを飲みながら読書をする女性」なかんじで出すために、ChatGPT に聞いてみました

chatgpt

プロンプトは以下

Woman enjoying iced coffee while reading a book at an open terrace cafe, taken with Canon EOS R5, 35mm lens, vibrant style, Kodak Portra 400 film.

Female reader sipping iced coffee at a sunny outdoor cafe, captured with Nikon D850, 50mm prime lens, vintage style, Fujifilm Pro 400H film.

Lady immersed in a book and drinking iced coffee in an alfresco cafe setting, photographed with Sony A7R IV, 24-70mm zoom lens, soft pastel style, Agfa Vista 200 film.

Woman leisurely reading and savoring iced coffee at a terrace cafe, shot with Panasonic Lumix S1R, 45mm fixed focal length lens, high contrast style, Ilford Delta 400 film.

Female bookworm with iced coffee at an inviting open-air cafe, captured with Fujifilm GFX 100, 63mm prime lens, warm tones style, Kodak Ektar 100 film.

これをこのままコピペして生成した結果

copy and paste then result

なんともどこかで見た覚えのあるタッチの絵ができました

lady at cafe who is reading books

では!