Stable Diffusionのプロンプトとは?基本的な考え方
Stable Diffusionをはじめとする画像生成AIは、プロンプト(指示文)の書き方次第で生成される画像のクオリティが大きく変わります。同じイメージを思い浮かべていても、プロンプトが違えば全く異なる画像が生成されます。
プロンプトの基本的な役割は2つです。
- ポジティブプロンプト:生成してほしい要素を指定する
- ネガティブプロンプト:生成してほしくない要素を除外する
この2つを適切に設定することが、高品質な画像生成の第一歩です。
Stable Diffusionのプロンプトは英語で書くのが基本ですが、日本語でも動作します。ただし英語の方が精度が高く、より詳細なコントロールが可能なため、本記事では英語プロンプトを中心に解説します。
プロンプト作成に手間をかけたくない場合は、ブラウザで使えるAI画像生成ツール Dzine もおすすめです。直感的なUIでスタイルを選ぶだけで高品質な画像が生成できます。
基本構文:プロンプトの書き方ルール
基本的な構造
Stable Diffusionのプロンプトはカンマ(,)で区切った単語・フレーズの列で構成されます。
[クオリティタグ], [被写体], [スタイル], [背景/環境], [ライティング], [カメラ設定]
例:
masterpiece, best quality, 1girl, anime style, cherry blossom background, soft natural lighting, portrait
単語の順序と重要度
プロンプトの先頭に書いた単語ほど影響力が強くなる傾向があります。クオリティタグを最初に置き、その後に重要な要素を順に記述するのが定石です。
重み付け(Emphasis)
特定のキーワードを強調したい場合は () でくくります。
(keyword):1.1倍の重みで強調(keyword:1.5):1.5倍の重みで強調(数値で細かく調整可能)[keyword]:0.9倍に弱める
例:(beautiful eyes:1.3), 1girl, portrait
クオリティタグ:画像品質を上げる必須キーワード
クオリティタグはほぼすべてのプロンプトに入れるべき「定番フレーズ」です。
汎用クオリティタグ一覧
masterpiece, best quality, high quality, ultra detailed, 8k, photorealistic
用途別クオリティタグ
写真・リアル系
RAW photo, photorealistic, realistic, hyperrealistic, DSLR, sharp focus
イラスト・アニメ系
masterpiece, best quality, highly detailed, beautiful, absurdres
3D・CG系
3D render, octane render, cinema 4d, ray tracing, subsurface scattering, high quality 3D
これらのタグをプロンプトの冒頭に入れるだけで、全体的な画像クオリティが大幅に向上します。
スタイルタグ:画風を指定するキーワード
アニメ・イラスト系スタイル
anime style # 一般的なアニメ風
manga style # 漫画風
chibi style # ちびキャラ風
studio ghibli style # ジブリ風(著作権注意)
watercolor # 水彩画風
oil painting # 油彩風
sketch # スケッチ風
写真・リアル系スタイル
editorial photography # 雑誌風
fashion photography # ファッション撮影風
portrait photography # ポートレート
street photography # ストリートフォト
macro photography # マクロ撮影
ライティングキーワード
golden hour # 夕方の黄金時間帯
soft natural light # 柔らかい自然光
studio lighting # スタジオライティング
dramatic lighting # ドラマチックな照明
rim lighting # リムライト(輪郭を際立てる)
volumetric light # 体積光(光が漏れる演出)
実践プロンプト集:10以上のコピペ例
ポートレート系
1. 現代的な女性ポートレート
masterpiece, best quality, RAW photo, 1woman, 25 years old, natural makeup, white shirt, outdoor cafe, golden hour lighting, bokeh background, portrait photography, sharp focus
2. アニメ風少女
masterpiece, best quality, 1girl, long silver hair, blue eyes, sailor uniform, cherry blossom park, spring, soft lighting, anime style, highly detailed
3. ファンタジーキャラクター
masterpiece, best quality, 1girl, elf ears, flowing white dress, enchanted forest, glowing magical particles, dramatic lighting, fantasy art, ultra detailed
風景・背景系
4. 都市夜景
masterpiece, best quality, cityscape at night, neon lights reflecting on wet streets, rain, cyberpunk atmosphere, ultra detailed, 8k, cinematic
5. 自然風景
masterpiece, best quality, mountain lake reflection, sunrise, mist over water, pine forest, golden hour, landscape photography, photorealistic, 4k
6. 室内インテリア
best quality, photorealistic, cozy japanese cafe interior, wooden furniture, warm lighting, plants, afternoon sunlight through window, interior design photography
商業・広告系
7. 商品撮影風
product photography, perfume bottle, minimalist white background, soft shadow, high key lighting, studio quality, ultra sharp, commercial advertisement style
8. フード写真
food photography, japanese ramen bowl, steam rising, overhead shot, dark background, restaurant quality, appetizing, highly detailed, 8k
アート・クリエイティブ系
9. 抽象アート
abstract art, flowing colors, blue and gold, geometric shapes, digital art, vibrant, dynamic, 4k, ultra detailed
10. レトロポスター風
retro poster, 1950s style, japanese travel poster, mount fuji, vintage color palette, flat design, art deco influence
11. サイバーパンク
cyberpunk city, neon signs, rain, chrome and neon colors, futuristic, night scene, cinematic lighting, blade runner style, ultra detailed
12. 水墨画風
ink wash painting, japanese style, bamboo forest, minimalist, black and white, traditional art, sumi-e, elegant
サンプリング設定:ステップ数と品質の関係
Sampling Stepsの目安
サンプリングステップ数(Sampling Steps)は生成の反復回数です。多いほど精細になりますが、一定以上は変化が少なくなります。
| ステップ数 | 特徴 | 推奨用途 | |-----------|------|---------| | 10〜15 | 高速・ラフ | プロンプトのテスト | | 20〜30 | バランスが良い | 通常の生成 | | 40〜50 | 高品質 | 最終仕上げ | | 50以上 | ほぼ変化なし | 非推奨 |
CFG Scale(プロンプト忠実度)の調整
CFG Scaleはプロンプトへの忠実度を決める数値です。
- 低め(5〜7):AIが自由に解釈する、創造的な結果
- 中程度(7〜9):バランスが良く最も一般的
- 高め(10〜15):プロンプト通りに生成するが硬くなりがち
まとめ:プロンプト上達の近道
Stable Diffusionのプロンプトは、試行錯誤の繰り返しで上達します。まずは本記事のサンプルプロンプトをそのままコピーして試してみて、気に入った要素を少しずつ変えていく方法が最も効率的です。
プロンプト作成に慣れないうちは、Dzine のようなビジュアルUIで直感的にスタイルを選べるツールを並行して使うことで、理想の画像イメージを素早く掴む練習になります。
プロンプトエンジニアリングのスキルは、一度身につけると複数のAI画像生成ツールで共通して活用できます。本記事を参考に、ぜひ自分だけのプロンプトライブラリを作り上げてください。
