GTX 16XXシリーズ・VRAM 4GB環境でStable Diffusion web UIを動かす
この記事の内容
- AUTOMATIC1111版「Stable Diffusion web UI」をWindows環境にインストールする手順を紹介します
- GTX 1650などVRAM 4GBのGPUでも動作する設定方法を解説します
- モデルファイルの配置場所やwebui-user.batの実行方法を説明します
- GTX 16XXシリーズ特有の黒画面・メモリ不足エラーの回避方法を紹介します
- コマンドライン引数の設定で実際に画像生成に成功した事例をお伝えします
Stable Diffusion web UIとは
今回紹介するのは「AUTOMATIC1111」が公開しているStable Diffusion web UIというリポジトリです。WebブラウザベースのリッチなUIを持ち、テキストから画像を生成する「Text to Image」や、画像から画像を生成する「Image to Image」、アウトペインティング、インペインティング、プロンプトマトリクスなど、多彩な機能を備えています。
特に注目すべき点として、VRAM 4GBのビデオカードをサポートしている点があります。GTX 1650などのエントリークラスGPUでも動作することが公式に示されています。
前提条件
インストール前に以下を用意しておく必要があります。
- Python(インストール済みであること)
- Git(インストール済みであること)
- Stable Diffusionのモデルファイル(
model.ckpt、約4GB)
モデルファイルは、以前に別のワンクリックインストーラー(Stable Diffusion v1.2.0対応版など)を使用していた場合、そのデータフォルダ内に model.ckpt として保存されているはずです。新たにダウンロードせず、既存のファイルを流用できます。
インストール手順
1. リポジトリのクローン
任意のフォルダをコマンドプロンプトで開き、以下のコマンドを実行します。
クローンが完了すると、stable-diffusion-webui というフォルダが作成されます。
2. モデルファイルの配置
クローンしたフォルダの中に入り、webui-user.bat と同じディレクトリに model.ckpt を配置します。
3. (オプション)GFPGANモデルの配置
顔画像をシャープに補正する「GFPGAN」モデルを同じディレクトリに配置することで、AI生成画像をさらに鮮明にする機能を利用できます。READMEに記載されているダウンロードコマンドを使うか、ブラウザから直接URLにアクセスしてダウンロードし、同フォルダに配置してください。
起動方法
webui-user.bat をダブルクリックして実行します。このとき、管理者として実行しないように注意してください。通常のユーザーとして実行するのが正しい手順です。
初回起動時は必要なライブラリのインストールが自動的に行われます。しばらく待つと、以下のようなメッセージが表示されます。
ブラウザでこのURLにアクセスすると、Web UIが表示されます。
2回目以降の起動では、インストール済みのステップはスキップされ、すぐに起動します。
GTX 16XXシリーズ向けトラブルシューティング
GTX 1650・GTX 1660などのGTX 16XXシリーズでは、そのままでは以下の問題が発生します。
- Out of Memory エラー:VRAMが不足して生成が開始できない
- 黒画面または緑一色の画像が生成される:このシリーズはハーフ精度の浮動小数点演算をサポートしていないため発生する
コマンドライン引数の設定
webui-user.bat をテキストエディターで開き、COMMANDLINE_ARGS の行に以下のオプションを追記します。
set COMMANDLINE_ARGS=--medvram --opt-split-attention --precision full --no-half
各オプションの意味は以下の通りです。
| オプション | 効果 |
|---|---|
--medvram | VRAMの使用を細かく管理し、メモリ不足を防ぐ |
--opt-split-attention | アテンション計算を分割してメモリ効率を改善する |
--precision full | 単精度(フル精度)で演算する |
--no-half | ハーフ精度を使わないようにする(GTX 16XXシリーズに必要) |
なお、--precision full --no-half を追加すると処理速度は低下しますが、GTX 16XXシリーズで正常に画像生成するためには必要な設定です。
設定後の動作確認
上記の設定を追記してwebui-user.batを再実行すると、VRAM使用量が2.7GB程度に抑えられながら処理が進むようになります。GTX 1650の環境で「apple」というプロンプトを入力したところ、約91秒で画像生成に成功しました。
まとめ
Stable Diffusion web UIは、GTX 1650などのVRAM 4GB環境でも動作するよう設計されており、Gitクローンとモデルファイルの配置だけで基本的なセットアップが完了します。
GTX 16XXシリーズ固有の問題については、webui-user.bat に --medvram --opt-split-attention --precision full --no-half というコマンドライン引数を追加することで解決できます。処理速度はやや遅くなりますが、エントリークラスのGPUでも無料で画像生成を楽しめる環境が整います。
プロンプトを工夫したり、バッチカウントやバッチサイズを増やして放置しておけば、多数の画像をまとめて生成することも可能です。まずは本記事の手順でセットアップを試してみてください。