【初心者向け】AI画像生成モデル選び完全ガイド|Checkpoint・LoRA・VAEの違いとおすすめ

AI画像生成

⚠️ 注意: AI画像生成時は著作権・肖像権にご注意ください。商用利用前には各サービスの利用規約をご確認ください。当ブログは生成された画像に関する責任を負いかねます。

要約

この記事では、Stable Diffusionで使用するモデルの選び方を初心者向けに解説します。ComfyUI・SD WebUIどちらでも使える共通の知識です。

Checkpoint、LoRA、VAE…いろんなモデルがあって何を選べばいいかわからない。そんな悩みをお持ちの方も大丈夫。各モデルの役割と違い、おすすめモデル、ダウンロード先まで、丁寧に説明していきます。


はじめに|モデル選びで画像の質が決まる

Stable Diffusionで画像を生成するとき、最も重要なのがモデル選びです。ComfyUIでもSD WebUIでも、使うモデルは同じです。

同じプロンプトでも、使うモデルによって結果が大きく変わります。

モデル選びの悩み:

  • Checkpointって何?LoRAとの違いは?
  • アニメ系とリアル系、どう選べばいい?
  • SD1.5とSDXL、どっちを使えばいい?
  • どこでダウンロードすればいい?

この記事を読めば、自分の目的に合ったモデルを選べるようになります。まだComfyUIを導入していない方は、先にComfyUIインストールガイドをご覧ください。

モチベル
モデルがたくさんあって、何を選べばいいか迷っちゃう…
クーラット
大丈夫!まずはモデルの種類を理解するところから始めよう

モデルの種類を理解しよう

Stable Diffusionで使うモデルは主に4種類あります。

Checkpoint(チェックポイント)

画像生成のベースとなるモデルです。絵柄や画風の基本を決めます。

項目 内容
役割 画像生成の基盤
ファイルサイズ 2GB〜7GB
拡張子 .safetensors / .ckpt
配置場所 models/checkpoints/

例: Stable Diffusion 1.5、SDXL、Juggernaut XL、Counterfeit-V3.0

ComfyUIでの基本的な使い方はComfyUI初心者ガイドで解説しています。

LoRA(ローラ)

Checkpointに追加で適用し、特定のスタイルやキャラを再現します。

項目 内容
役割 スタイル・キャラの追加
ファイルサイズ 10MB〜300MB
拡張子 .safetensors
配置場所 models/loras/

関連: 詳しい使い方は LoRA活用ガイド を参照してください(準備中)

VAE(ブイエーイー)

画像の色味や鮮やかさを調整するモデルです。

項目 内容
役割 色調・彩度の調整
ファイルサイズ 300MB〜800MB
拡張子 .safetensors / .pt
配置場所 models/vae/

Embedding(エンベディング)/ Textual Inversion

特定の概念やスタイルをプロンプトで呼び出せるようにします。

項目 内容
役割 概念の追加(ネガティブ用も多い)
ファイルサイズ 数KB〜数MB
拡張子 .safetensors / .pt
配置場所 models/embeddings/
モチベル
Checkpointがベースで、LoRAで味付けするイメージかな?
クーラット
その通り!VAEは色の調整、Embeddingは便利なショートカットみたいなものだね

SD1.5 vs SDXL|どちらを選ぶ?

Checkpointには大きく分けて2つの世代があります。

SD1.5(Stable Diffusion 1.5)

項目 内容
推奨サイズ 512×512
VRAM 4GB〜
特徴 軽量、モデル豊富、LoRA多数
向いている人 初心者、VRAM少ない環境

SDXL(Stable Diffusion XL)

項目 内容
推奨サイズ 1024×1024
VRAM 8GB〜
特徴 高品質、ディテール豊富
向いている人 高品質重視、VRAM十分な環境

どちらを選ぶべき?



SD1.5がおすすめな場合
– VRAM 6GB以下
– 生成速度を重視
– 特定のLoRAを使いたい
– アニメ系イラストがメイン


SDXLがおすすめな場合
– VRAM 8GB以上
– 高品質・高解像度が必要
– リアル系がメイン
– 最新技術を使いたい

ヒント

迷ったらSD1.5から始めるのがおすすめ。軽量で扱いやすく、学習コストが低いです。

用途別おすすめCheckpoint

※以下は2026年2月時点のおすすめです。最新の人気モデルはCivitaiのダウンロード数順で確認できます。

商用利用に関する重要な注意

各モデルのライセンスは予告なく変更される場合があります。商用利用する場合は、必ず各モデルの公式ページ(CivitaiまたはHugging Face)で最新のライセンスを確認してください。この記事の情報は参考としてご活用ください。

アニメ・イラスト系(SD1.5)

モデル名 特徴 おすすめ度 商用利用
Counterfeit-V3.0 繊細な塗り、美しい色彩 ★★★★★ OK
MeinaMix V12 Final 可愛い系、柔らかい雰囲気 ★★★★☆ OK
AbyssOrangeMix3 (AOM3) 高品質、やや重め ★★★★☆ 一部NG
AbyssOrangeMix3の商用利用について

AOM3A1はChilloutMixを含むため商用利用NGです。商用利用する場合はAOM3A1B・A2・A3・Bバリアントを選んでください。

初心者おすすめ: Counterfeit-V3.0
繊細な塗りと美しい色彩で、様々なスタイルに対応できます。商用利用もOKです。

同じプロンプトで生成した比較画像がこちらです。モデルごとの画風の違いを確認してみてください。

アニメ系SD1.5モデル比較:Counterfeit-V3.0・MeinaMix V12 Final
左からCounterfeit-V3.0、MeinaMix V12 Final(同一プロンプトで生成)

アニメ・イラスト系(SDXL)

モデル名 特徴 おすすめ度 商用利用
Animagine XL V4.0 高品質アニメ、公式推奨 ★★★★★ OK
Kohaku-XL-Zeta 日本アニメ風、美しい ★★★★☆ 条件付き
Pony Diffusion V6 XL 独自タグシステム ★★★★☆ 条件付き
Kohaku-XL-Zetaのライセンスについて

Kohaku-XL-ZetaはFAIPL-1.0-SD(Fair AI Public License)を採用しています。生成画像の商用利用はOKですが、モデルをAPIサービスとして提供する場合はソースコード公開義務があります(コピーレフト型ライセンス)。なお旧版のKohaku-XL-BetaはCreativeML Open RAIL++-Mで商用制限なしです。
Pony Diffusion V6 XLの商用利用について

収益化サービス(有料推論・優先プランなど)でのモデル利用は原則禁止されています。派生モデル・マージモデルにもこの制限が適用されます。商用利用する場合はcontact@purplesmart.aiへの連絡が必要です。個人利用での画像生成やブログへの掲載は問題ありません。

同じプロンプトで生成した比較画像がこちらです。

アニメ系SDXLモデル比較:Animagine XL V4.0・Kohaku-XL-Zeta
左からAnimagine XL V4.0、Kohaku-XL-Zeta(同一プロンプトで生成)

リアル・写真系(SD1.5)

モデル名 特徴 おすすめ度 商用利用
Realistic Vision V6.0 B1 リアル系の定番 ★★★★★ OK
ChilloutMix アジア人風、美しい肌 ★★★★☆ NG
CyberRealistic vFinal 高品質リアル ★★★★☆ OK
ChilloutMixの商用利用について

ChilloutMixは生成画像の販売・収益サイトでの利用が全面禁止されています。個人利用・趣味の範囲での使用にとどめましょう。商用利用が必要な場合はRealistic Vision V6.0 B1やCyberRealistic vFinalをおすすめします。

同じプロンプトで生成した比較画像がこちらです。

リアル系SD1.5モデル比較:Realistic Vision V6.0 B1・CyberRealistic vFinal
左からRealistic Vision V6.0 B1、CyberRealistic vFinal(同一プロンプトで生成)

リアル・写真系(SDXL)

モデル名 特徴 おすすめ度 商用利用
Juggernaut XL V9 最高品質、汎用的 ★★★★★ 条件付き
RealVisXL V5.0 リアル特化 ★★★★★ OK
DreamShaper XL アート寄り ★★★★☆ OK
Juggernaut XL V9の商用利用について

作者は「マージ・学習・画像販売など何でもOK」と明言しています。ただしCivitai上ではAPIレンタル利用が許可設定に含まれておらず、ビジネス利用・商用ライセンスの問い合わせ先としてjuggernaut@rundiffusion.comが案内されています。ブログやSNSへの画像掲載は問題ありません。
DreamShaper XLのバージョンについて

Civitaiでは複数バージョンが公開されています。通常版は「alpha2 (xl1.0)」で、商用利用OKです。Lightning版・Turbo版はStability AIのDistilled技術を使用しているため、コミュニティライセンスが適用され、年間売上100万ドル超の場合はエンタープライズライセンスが必要です。個人ブログでの利用はどのバージョンでも問題ありません。

同じプロンプトで生成した比較画像がこちらです。

リアル系SDXLモデル比較:RealVisXL V5.0・DreamShaper XL
左からRealVisXL V5.0、DreamShaper XL(同一プロンプトで生成)

初心者おすすめ: RealVisXL V5.0
商用利用も安心で、SDXLの中でも高品質なリアル画像が生成できます。Juggernaut XL V9も優秀ですが、APIサービス利用には制限があります。

モチベル
アニメならCounterfeit-V3.0、リアルならRealVisXL V5.0がいいのね!
クーラット
まずはその2つから始めて、慣れてきたら他も試してみるといいよ

おすすめVAE

VAEを変えると、画像の色味が大きく変わります。

SD1.5用VAE

VAE名 特徴
vae-ft-mse-840000 標準的、バランス型
kl-f8-anime2 アニメ向け、鮮やか
blessed2 彩度高め、華やか

SDXL用VAE

VAE名 特徴
sdxl_vae 公式VAE、標準
sdxl-vae-fp16-fix 軽量版、品質維持
情報

多くのCheckpointにはVAEが内蔵されています。色味に不満がなければ、別途VAEを用意する必要はありません。

おすすめEmbedding

Embeddingはネガティブプロンプト用が特に便利です。

ネガティブ用Embedding

Embedding名 効果 ライセンス 商用利用
EasyNegative 汎用ネガティブ、品質向上 正式ライセンスなし(Civitai上で商用許可) OK
bad-hands-5 手の崩れを軽減 ライセンス未指定 不明
bad_prompt_version2 品質低下を防止 CreativeML OpenRAIL-M OK
ng_deepnegative 深層ネガティブ 正式ライセンスなし(Civitai上で一部許可) 条件付き
Embeddingのライセンスについて

bad-hands-5は原作者(yesyeahvh)がライセンスを一切明示していません。Civitaiの再アップロード者が商用許可を設定していますが、権限の正当性は不明です。商用利用する場合はbad_prompt_version2(CreativeML OpenRAIL-M)を推奨します。ng_deepnegativeはCivitai上でモデル自体の販売(Sell)が許可されていないため、再配布には注意してください(画像の商用利用はOK)。

使い方:
ネガティブプロンプトに EasyNegative と記述するだけで効果を発揮します。

ネガティブプロンプト例:
EasyNegative, bad-hands-5, lowres, bad anatomy

モデルのダウンロード先

Civitai(シビタイ)

Civitai | Discover and Create AI Art
Explore thousands of free Stable Diffusion & Flux models, create and share AI-generated art, and join the world's larges...

特徴:

  • 最大手のモデル共有サイト
  • Checkpoint、LoRA、VAE、Embeddingすべて揃う
  • サンプル画像とプロンプトが見られる
  • コミュニティが活発

おすすめポイント:

  • ダウンロード数順でソートすると人気モデルがわかる
  • モデルごとに推奨設定が記載されている

Hugging Face(ハギングフェイス)

Hugging Face – The AI community building the future.
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

特徴:

  • 公式モデルが多い
  • 研究者・開発者向け
  • 品質が安定している

おすすめポイント:

  • Stable Diffusion公式モデルはここからダウンロード
  • ControlNet、IPAdapterなどのモデルも公開
モチベル
Civitaiでいろんなモデルが見られるんだね!楽しそう
クーラット
サンプル画像を見て選べるから、イメージに合うモデルが見つけやすいよ

モデルの配置場所

ダウンロードしたモデルは、種類ごとに正しいフォルダに配置します。

ComfyUIの場合

ComfyUI/
└── models/
    ├── checkpoints/     ← Checkpoint (.safetensors)
    ├── loras/           ← LoRA (.safetensors)
    ├── vae/             ← VAE (.safetensors / .pt)
    ├── embeddings/      ← Embedding (.safetensors / .pt)
    ├── controlnet/      ← ControlNet
    ├── ipadapter/       ← IPAdapter
    ├── clip_vision/     ← CLIP Vision
    └── upscale_models/  ← アップスケーラー

SD WebUI(AUTOMATIC1111 / Forge)の場合

stable-diffusion-webui/
└── models/
    ├── Stable-diffusion/  ← Checkpoint (.safetensors)
    ├── Lora/              ← LoRA (.safetensors)
    ├── VAE/               ← VAE (.safetensors / .pt)
    └── embeddings/        ← Embedding (.safetensors / .pt)
注意

モデルを間違ったフォルダに入れると認識されません。ファイルの種類を確認して配置しましょう。

モデル選びのポイント

1. 目的を明確にする

まず「どんな画像を作りたいか」を決めましょう。

目的 おすすめモデル
アニメイラスト Counterfeit-V3.0 / Animagine XL V4.0
リアル人物 Realistic Vision V6.0 B1 / Juggernaut XL V9
背景・風景 Juggernaut XL V9 / DreamShaper XL
2.5D・半リアル ChilloutMix / MeinaMix V12 Final

2. サンプル画像を確認

Civitaiでは各モデルのサンプル画像が見られます。

  • 自分のイメージに近いサンプルがあるか
  • 使用されているプロンプトを参考にできるか
  • LoRAとの組み合わせ例はあるか

3. ダウンロード数・評価を参考に

人気のあるモデルは品質が安定しています。

  • ダウンロード数が多いものは信頼性が高い
  • 評価(★)が高いものを選ぶ
  • 更新日が新しいものは最新の技術を使っている

4. VRAMと相談

VRAMが少ない場合は軽量なモデルを選びましょう。

VRAM おすすめ
4GB SD1.5の軽量モデル
6GB SD1.5全般
8GB SDXL(やや制限あり)
12GB以上 SDXL全般
VRAMが足りなくてもSDXLを使いたい場合

SDXLを使いたいけどVRAMが8GB未満…という方は、ブラウザだけで高性能GPUが使えるクラウド環境も検討してみてください。ConoHa AI Canvasのレビュー記事で使い勝手を紹介しています。

よくある失敗と対処法

モデルが認識されない

確認ポイント:

  • 正しいフォルダに配置しているか
  • ファイルが破損していないか(再ダウンロード)
  • ComfyUI / SD WebUIを再起動したか

画像が崩れる・品質が低い

対処法:

  • モデルに合った推奨サイズで生成(SD1.5は512、SDXLは1024)
  • VAEを変更してみる
  • サンプル画像のプロンプトを参考にする(プロンプト辞典まとめも活用してみてください)

LoRAが効かない

確認ポイント:

  • LoRAのベースモデルが合っているか(SD1.5用?SDXL用?)
  • 強度が適切か(0.7〜1.0程度)
  • トリガーワードが必要か確認
モチベル
SD1.5用のLoRAをSDXLで使っちゃダメなのね
クーラット
そうそう。ベースモデルを合わせるのが大事だよ

よくある質問


QCheckpointは何個くらい持っておけばいいですか?
A

最初は2〜3個で十分です。アニメ用1つ、リアル用1つがあれば多くの用途に対応できます。慣れてきたら用途に応じて増やしていきましょう。

Qsafetensorsとckptの違いは何ですか?
A

safetensorsは新しいフォーマットで、セキュリティが高く読み込みも高速です。現在はsafetensorsが主流なので、迷ったらsafetensorsを選びましょう。

QVAEは必ず必要ですか?
A

必須ではありません。多くのCheckpointにはVAEが内蔵されています。色味に不満がある場合や、特定のスタイルを求める場合に別途用意すると良いでしょう。

Qモデルのファイルサイズが大きいのですが、圧縮できますか?
A

モデルファイルはすでに圧縮されており、これ以上の圧縮は推奨されません。ストレージが不足する場合は、使わないモデルを別のドライブに移動するか、削除を検討してください。


まとめ|目的に合ったモデルで理想の画像を

この記事のポイント

  1. 4種類のモデル:Checkpoint(ベース)、LoRA(追加)、VAE(色調)、Embedding(概念)
  2. SD1.5 vs SDXL:VRAM少ないならSD1.5、高品質ならSDXL
  3. おすすめCheckpoint:アニメはCounterfeit-V3.0 / Animagine XL V4.0、リアルはRealVisXL V5.0
  4. ダウンロード先:Civitai(豊富)とHugging Face(公式)
  5. 配置場所:種類ごとに正しいフォルダへ

次のステップ

  • まずはCounterfeit-V3.0かRealVisXL V5.0をダウンロード
  • EasyNegativeを入れてネガティブプロンプトを強化
  • 慣れてきたらLoRAで自分好みのスタイルを追加

モデル選びがわかれば、画像生成の幅が大きく広がります。いろんなモデルを試して、自分のお気に入りを見つけてください!

モチベル
モデルの違いがわかってきた!まずはCounterfeit-V3.0から試してみる
クーラット
いいね!サンプル画像を参考にしながら、自分好みのモデルを探していこう

関連記事

モデルを活用して、さらにAI画像生成を楽しみましょう!

【2026年版】ComfyUIインストール方法|AI画像生成ローカル環境構築ガイド
AI画像生成をローカルPCで始めるならComfyUIがおすすめ。Windows版のインストール方法を初心者向けに解説。Python・Git不要のポータブル版で簡単セットアップ。推奨GPU・必要スペックから初めての画像生成まで手順をスクショ付きで紹介。
404 NOT FOUND | FreeCraftLog
自由な発想で、世界を彩ろう
【保存版】ComfyUIプロンプト集|330種類を6カテゴリで完全網羅
AI画像生成で使えるプロンプト330種類を6カテゴリ別に一覧掲載。キャラクター・表情・衣装・ポーズ・背景・カメラアングルをコピペですぐ使える。ComfyUI・Stable Diffusion WebUI両対応の総合リファレンス。
ConoHa AI Canvas を使ってみた|Automatic1111 はどこまで快適?正直レビュー
ConoHa AI Canvas を実際に使ってみた正直レビュー。月額1,100円から始められるクラウドGPU環境で、Automatic1111の生成速度・安定性・料金プランを徹底解説。環境構築不要でStable Diffusionを始めたい人必見です。

⚠️ AI画像生成をご利用の際の重要な注意事項

著作権・知的財産権について

  • 既存のキャラクター、作品、ブランドロゴなどの模倣・複製は著作権侵害にあたる可能性があります
  • 商用利用時は特に注意が必要です

肖像権について

  • 実在人物(著名人・一般人問わず)の顔や特徴を模倣した画像生成はお控えください
  • 無断での肖像権使用は法的トラブルの原因となります

利用規約の確認

  • 各AI画像生成サービスの利用規約を必ずご確認ください
  • 商用利用の可否、生成画像の権利関係は各サービスで異なります

免責事項

  • 当ブログの情報を参考にしたAI画像生成により生じた問題について、当ブログは一切の責任を負いません
  • 法的問題が生じた場合は、利用者の自己責任となります
  • 最新の法律・規約情報は公式情報をご確認ください

適切なAI画像生成を心がけ、創作活動を楽しみましょう。
詳細についてはAIと著作権についてをご覧ください。

コメント