← [ TECH / 技術部 ] に戻る
OBSERVATION · 其の3643 · 2026.04.19

RealVisXL V5.0 導入・使い方|ComfyUIで動かす写実特化SDXL(チェックポイントチェリーピック4)

チェックポイントチェリーピック (4)|RealVisXL V5.0 — pareido.jp 現行アイキャッチの源流 — RealVisXL, V5.0, SDXL 1.0

こんにちは、パレイド技術部です。

本記事は RealVisXL V5.0(SDXL ベースの写実特化モデル)の 入手先・ComfyUI への導入手順・商用利用の可否・実写の描写力 を、RTX 4070 / ComfyUI で実測しながらまとめる回です。「現行アイキャッチに使っているモデルを自分でも導入して使いたい」人向けの実用記事として読めます。導入だけ知りたい方は後半の「出自と系統」「環境とセットアップ」を、品質を見たい方は「ベンチマーク」をご覧ください。

前回 4/17 までで Juggernaut XL ファミリーを Ragnarok / Jugg_XI 通常 / Jugg_XI Lightning の 3 つを試しました。今回からは別ファミリー、RealVisXL に視点を移します。

パレイドJuggernaut XL Jugg_XI Lightning 導入・使い方|4-step蒸留SDXLで何が残るか(チェックポイントチェリーピック3)こんにちは、パレイド技術部です。 前回 4/16 は Juggernaut XL Jugg_XI by_RunDiffusion (通常版) を取り上げ、Rag…

現在、当サイトのサムネイルは、多くが本連載の第 1 回 (4/15) サマリ表で「現行 eyecatch」として挙げた RealVisXL ファミリー (Turbo / Lightning 派生) で生成されたものです。「チェックポイントチェリーピック」連載で本流のチェックポイントを順に取り上げる以上、自分たちが日々使っているモデルの素性を改めて記録しておく べき、というのが今回の動機です。

本記事では RealVisXL V5.0 通常版 (SG161222/RealVisXL_V5.0fp16 単一ファイル) を共通 6 プロンプトで走らせ、明日 4/20 で V5.0 Lightning 派生まで進みます。Juggernaut の 3-pack と同じく今回 = 通常版 / 次回 = 高速派生の構造です。

本記事はローカル LLM による自動執筆パイプラインで生成されました。現段階ではクラウド AI(Claude 等)の補助や人間の編集が介在していますが、pareido.jp では最終的に AI が自律的にコンテンツを制作できる仕組みの構築を目指しています。

出自と系統

RealVisXL は SG161222 (Mage.Space スポンサー) が公開する SDXL 1.0 ベースの merge モデルです。シリーズ名どおり写実 (Real Vision) 重視で、SG161222 自身が HF README で「The model is aimed at photorealism」と明言しています。Juggernaut の “万能写実” に対して、RealVisXL は写実そのものを掘り進める 系統です。

リリース ベース バリエーション
V1.0 2023 後半 SDXL 1.0 BakedVAE
V2.0 2024 前半 SDXL 1.0 BakedVAE
V3.0 / V3.0 Inpaint 2024 中盤 SDXL 1.0 BakedVAE
V4.0 / V4.0 Lightning 2024 後半 SDXL 1.0 / Lightning BakedVAE
V5.0 (本記事) 2024 終盤 SDXL 1.0 fp16 / fp32 / BakedVAE
V5.0 Lightning (4/20) 2024 終盤 SDXL Lightning BakedVAE

V5.0 は同シリーズの最新世代で、HF 配布では RealVisXL_V5.0_fp16.safetensorsRealVisXL_V5.0_fp32.safetensors の 2 ファイル、CivitAI 配布では BakedVAE 版が並ぶ構成です。本記事では HF の fp16 単一ファイルを採用しました (公開リポジトリで token 不要、ComfyUI に置けばすぐロード)。

入手先:

huggingface.coSG161222/RealVisXL_V5.0 · Hugging FaceWe’re on a journey to advance and democratize artificial intelligence through open source and open science.huggingface.co

ライセンスと商用利用

HF README の license フィールドは openrail++ = CreativeML Open RAIL++-M。Juggernaut XL と同系のライセンスで、商用利用 / 生成物販売 / 再配布 / 派生 OK (RAIL の Use-based Restrictions の範囲内で)。

判定 根拠条項 / 解釈
商用利用 RAIL++-M の標準条項。SG161222 の HF README にも追加制限なし
生成物の販売 同上
モデル再配布 同上 (帰属表示推奨)
派生 (merge / LoRA) 同上
学習データ透明性 merge ベース、詳細非開示 (RAIL 系慣習)

判定: 安心して使える ○。Juggernaut XL と同じ枠で扱える。

環境とセットアップ

検証環境は前 3 記事と同じ Windows 機の RTX 4070 / 12GB です。

項目
GPU RTX 4070 12GB
ComfyUI 0.19.3 / PyTorch 2.11.0+cu130
ファイル RealVisXL_V5.0_fp16.safetensors (約 6.94 GB)
入手先 HuggingFace SG161222/RealVisXL_V5.0 (RealVisXL_V5.0_fp16.safetensors を直接 DL)

HF の公開リポジトリなので token なしで curl で直接取れます。ダウンロード後 ComfyUI の models/checkpoints/ に置けば、Load Checkpoint の一覧に RealVisXL_V5.0_fp16.safetensors が現れます。

ベンチマーク

連載統一条件 (steps=30 / cfg=4.0 / seed=42 / 1264×848 / dpmpp_2m / karras) で実走。CivitAI の作者推奨は DPM++ SDE Karras 30+ / DPM++ 2M Karras 50+ ですが、本連載では SDXL 横断比較のため dpmpp_2m / karras / 30 step / cfg 4.0 で揃えています (作者推奨範囲の中)。

判定軸: 安定 / ばらつき or 品質懸念 / × 破綻・OOM

プロンプト GPU 占有 生成秒 結果 所見
01_workspace_en (英語写実) ~7.9 GB 286.7 s ※ ※ session 初回はモデルロード + VAE bake を含む。3 枚の Apple 風モニタ + 木目デスク + 暖色デスクランプ + 観葉植物、シネマティックで Juggernaut より一段「写真的」な空気。
02_workspace_ja_title (日本語タイトル) ~7.9 GB 14.3 s × 北欧調の明るいデスクと壁ポスター 2 枚。ポスター文字は日本語の字形に寄ってはいるが完全幻覚、SDXL の日本語限界は変わらず
03_abstract_neural (抽象 + 中央空け) ~7.9 GB 12.9 s 紫青のニューラル網は美しいが、中央に主役のニューロン球体が居座って中央空けは実現せず (Ragnarok と同パターン)
04_comic_panel (マンガ調 + 「実測!」) ~7.9 GB 12.6 s × アニメ調のヘッドセット男 + マルチモニタ、cel-shaded は綺麗に描けたが吹き出し自体が描画されない。Jugg_XI が吹き出し形まで出した点で後退
05_iso_cityscape (アイソメ) ~7.9 GB 11.2 s パステルピンク/紫のトーン一致、サーバーラック密度は Jugg_XI 同等、整然
06_poster_mixed (日英混在ポスター) ~7.9 GB 11.7 s × MacBook が中央に居座る構図、マゼンタ/シアンのネオングリッド背景は出るが、プロンプト指定の英字タイポ・日本語ともに未描画

実際の出力

01 workspace_en
02 workspace_ja_title
03 abstract_neural
04 comic_panel
05 iso_cityscape
06 poster_mixed

結果のサマリ — Juggernaut との差分

  • ○△× の比率: ○ 2 / △ 1 / × 3。Ragnarok / Jugg_XI の ○ 2 / △ 2 / × 2 から 1 つだけ × が増えた (04 で吹き出しが描画されない)
  • 絵柄の傾向差: 01 はより写真的・ドキュメンタリー調 (Juggernaut のシネマティック寄りと違い、生活感のある実空間のトーン)。画面の表示内容は崩れ気味。”写実専門” のためか04 アニメ調や、05 のアイソメは細部が弱い。
  • 速度: 1 枚あたり steady-state で 11 – 14 秒 (Jugg_XI ~33 秒 / Ragnarok ~40 秒)。同じ steps=30 / cfg=4.0 / dpmpp_2m / karras 条件で 2 – 3 倍速い。HF 配布の fp16 単一ファイルが UNet を 7.9 GB のまま VRAM 常駐させ、ComfyUI のオフロードが走らないことが効いている (Juggernaut 系では VRAM 占有が 1.3 – 11.6 GB に変動していたのと対照的)
  • コールドスタート: session 初回は 286.7 秒。これは SDXL UNet + VAE のロード + bake で、HF 配布の fp16 ファイルを ComfyUI が初めて触る場面のコスト。同じ Python セッション内 2 枚目以降は 11-14 秒に収束する
  • テキスト描画: 02 / 06 / 04 すべて崩壊。SDXL 横断で変わらず

「Juggernaut = SDXL 万能写実の到達点」「RealVisXL V5.0 = SDXL 写実専用の到達点 + 推論が速い」というキャラ分けが見えてきました。

強みを引き出す例 — 写実ポートレートで Juggernaut との差は出るか

RealVisXL の押し領域は HF README が明言するとおり 写実 (photorealism)。Juggernaut XL の押し領域 (写実ポートレート + 自然光) と完全に重なるので、敢えて Juggernaut Jugg_XI の 07/08/09 と同じプロンプト・同 seed で並べてみる のが本記事の比較です。

プロンプト 生成秒 結果 所見
07 クローズアップポートレート (肌・自然光) 70.7 s ※ ※ session 初回。そばかすの粒子数と分布が Juggernaut より明らかに密、毛穴と肌のテクスチャは「肌診断器の写真」に近い生々しさ。陰影や明るさが自然で、”Real Vision” が押す領域そのまま
08 環境ポートレート (霧 + 逆光) 13.2 s ゴールデンアワー + 霧 + ウールコート、人物が 1 人 (Jugg_XI で 2 人になったケースと違い指示通り)。霧のボリュメトリック光線も Juggernaut 同等
09 ドラマティック光線 (レンブラント) 17.8 s 老職人 + 暗部 + 工房、Juggernaut と比べてより「素の写真」寄り (Annie Leibovitz 的な絵画調ではなく、ドキュメンタリーの 1 シーン)。手のシワと工房の質感は同等
07 portrait_skin
08 environmental
09 dramatic_lighting

3 枚とも文句なしの ○。同じプロンプト・同 seed で並べると、Juggernaut のシネマティック (映画的演出寄り) と RealVisXL のドキュメンタリー (素の写真寄り) の絵作りの違い が明確に出ました。

  • 07 の差: そばかすの粒子密度で RealVisXL > Juggernaut。”肌のリアルさ” を最優先するなら RealVisXL
  • 08 の差: RealVisXL は人物 1 人、Jugg_XI は 2 人 (Ragnarok は 1 人)。同じプロンプト・同 seed でもファミリー間で構図解釈が変わる好例
  • 09 の差: Juggernaut が「肖像写真家風」なのに対し、RealVisXL は「現場ドキュメンタリー風」。どちらが好みか次第

実用判断: アイキャッチ用途で写実そのものの “肌の毛穴・産毛・そばかす” を画面に乗せたいなら RealVisXL V5.0、ストーリーテリングのある写真表現なら Juggernaut、という棲み分けが妥当です。

棚での位置づけ — Juggernaut と RealVisXL の使い分け

用途 第一候補 理由
SDXL 系の “完成形” を 1 本選ぶなら Juggernaut Ragnarok farewell 作、SDXL ラインの締めくくり
Lightning 派生まで降りたい SDXL 系 Juggernaut Jugg_XI 公式に Lightning 派生がある最後の世代
写実そのものを掘りたい SDXL 系 RealVisXL V5.0 写実専門 merge、pareido.jp アイキャッチ実運用
日本語タイトル込み ERNIE-Image-Turbo 多言語テキスト描画

Juggernaut が SDXL 万能写実の到達点、RealVisXL が SDXL 写実専用の到達点、という棚分けが自然です。日々のアイキャッチ用途で写実を掘りたいときは RealVisXL、構図やポーズが多彩な汎用シーンを描きたいときは Juggernaut、という使い分けになります。

次回予告

次回は RealVisXL V5.0 Lightning です。Juggernaut Jugg_XI Lightning と同じく Euler / sgm_uniform / cfg=1.0 / 4 step の連載統一 Lightning 条件で再走、本記事の通常版 30 step との品質トレードオフを確認します。写実専用モデルを 4-step まで蒸留したときに、写実の “肌の毛穴” は残るかが論点です。

安心して使える SDXL 写実派の現行最新版として RealVisXL V5.0 はそのまま使えるチェックポイント、というのが本記事の判定です。次回は同じ V5.0 系で速さを取った Lightning 派生を見ます。

▶ 関連動画 · YOUTUBE
━━ 観るのを再開 ━━
前の記事を読む
技術部 · 1.58-bit LLM「Ternary Bonsai 8B」が登場|MLXネイティブ対応、M5 Mac で前作と比較してみた
動画を観る
YouTube
次の記事を読む
技術部 · サムネイル自動生成の追試|ERNIE-Image-Turbo を RTX 4070 + ComfyUI で試す
━━ 他の観測領域 ━━
TECH · 技術部
RealVisXL V5.0 の導入と使い方|ダウンロード・推奨設定・VAE NaN 回避まで(SDXL 写実モデル)
PHIL · 思想部
同じ幽霊でも、石燕と暁斎では別の手 ── 写実化が剝がす「画家の画風」
FRONT · 辺境部
機械に棲む山彦 第8回: 存在は名乗っていた——空耳の主を検索したら実在した