チェックポイントチェリーピック (4)｜RealVisXL V5.0 — pareido.jp 現行アイキャッチの源流

こんにちは、パレイド技術部です。

前回 4/17 までで Juggernaut XL ファミリーを Ragnarok / Jugg_XI 通常 / Jugg_XI Lightning の 3 つを試しました。今回からは別ファミリー、RealVisXL に視点を移します。

現在、当サイトのサムネイルは、多くが本連載の第 1 回 (4/15) サマリ表で「現行 eyecatch」として挙げた RealVisXL ファミリー (Turbo / Lightning 派生) で生成されたものです。「チェックポイントチェリーピック」連載で本流のチェックポイントを順に取り上げる以上、自分たちが日々使っているモデルの素性を改めて記録しておく べき、というのが今回の動機です。

本記事では RealVisXL V5.0 通常版 (SG161222/RealVisXL_V5.0 の fp16 単一ファイル) を共通 6 プロンプトで走らせ、明日 4/20 で V5.0 Lightning 派生まで進みます。Juggernaut の 3-pack と同じく今回 = 通常版 / 次回 = 高速派生の構造です。

本記事はローカル LLM による自動執筆パイプラインで生成されました。現段階ではクラウド AI（Claude 等）の補助や人間の編集が介在していますが、pareido.jp では最終的に AI が自律的にコンテンツを制作できる仕組みの構築を目指しています。

出自と系統
ライセンスと商用利用
環境とセットアップ
ベンチマーク
強みを引き出す例 — 写実ポートレートで Juggernaut との差は出るか
棚での位置づけ — Juggernaut と RealVisXL の使い分け
次回予告

出自と系統

RealVisXL は SG161222 (Mage.Space スポンサー) が公開する SDXL 1.0 ベースの merge モデルです。シリーズ名どおり写実 (Real Vision) 重視で、SG161222 自身が HF README で「The model is aimed at photorealism」と明言しています。Juggernaut の “万能写実” に対して、RealVisXL は写実そのものを掘り進める 系統です。

版	リリース	ベース	バリエーション
V1.0	2023 後半	SDXL 1.0	BakedVAE
V2.0	2024 前半	SDXL 1.0	BakedVAE
V3.0 / V3.0 Inpaint	2024 中盤	SDXL 1.0	BakedVAE
V4.0 / V4.0 Lightning	2024 後半	SDXL 1.0 / Lightning	BakedVAE
V5.0 (本記事)	2024 終盤	SDXL 1.0	fp16 / fp32 / BakedVAE
V5.0 Lightning (4/20)	2024 終盤	SDXL Lightning	BakedVAE

V5.0 は同シリーズの最新世代で、HF 配布では RealVisXL_V5.0_fp16.safetensors と RealVisXL_V5.0_fp32.safetensors の 2 ファイル、CivitAI 配布では BakedVAE 版が並ぶ構成です。本記事では HF の fp16 単一ファイルを採用しました (公開リポジトリで token 不要、ComfyUI に置けばすぐロード)。

入手先:

HuggingFace: SG161222/RealVisXL_V5.0
CivitAI: RealVisXL V5.0 (modelVersionId 789646)

ライセンスと商用利用

HF README の license フィールドは openrail++ = CreativeML Open RAIL++-M。Juggernaut XL と同系のライセンスで、商用利用 / 生成物販売 / 再配布 / 派生 OK (RAIL の Use-based Restrictions の範囲内で)。

軸	判定	根拠条項 / 解釈
商用利用	○	RAIL++-M の標準条項。SG161222 の HF README にも追加制限なし
生成物の販売	○	同上
モデル再配布	○	同上 (帰属表示推奨)
派生 (merge / LoRA)	○	同上
学習データ透明性	△	merge ベース、詳細非開示 (RAIL 系慣習)

判定: 安心して使える ○。Juggernaut XL と同じ枠で扱える。

環境とセットアップ

検証環境は前 3 記事と同じ Windows 機の RTX 4070 / 12GB です。

項目	値
GPU	RTX 4070 12GB
ComfyUI	0.19.3 / PyTorch 2.11.0+cu130
ファイル	`RealVisXL_V5.0_fp16.safetensors` (約 6.94 GB)
入手先	HuggingFace SG161222/RealVisXL_V5.0 (`RealVisXL_V5.0_fp16.safetensors` を直接 DL)

HF の公開リポジトリなので token なしで curl で直接取れます。ダウンロード後 ComfyUI の models/checkpoints/ に置けば、Load Checkpoint の一覧に RealVisXL_V5.0_fp16.safetensors が現れます。

ベンチマーク

連載統一条件 (steps=30 / cfg=4.0 / seed=42 / 1264×848 / dpmpp_2m / karras) で実走。CivitAI の作者推奨は DPM++ SDE Karras 30+ / DPM++ 2M Karras 50+ ですが、本連載では SDXL 横断比較のため dpmpp_2m / karras / 30 step / cfg 4.0 で揃えています (作者推奨範囲の中)。

判定軸: ○ 安定 / △ ばらつき or 品質懸念 / × 破綻・OOM

プロンプト	GPU 占有	生成秒	結果	所見
01_workspace_en (英語写実)	~7.9 GB	286.7 s ※	○	※ session 初回はモデルロード + VAE bake を含む。3 枚の Apple 風モニタ + 木目デスク + 暖色デスクランプ + 観葉植物、シネマティックで Juggernaut より一段「写真的」な空気。
02_workspace_ja_title (日本語タイトル)	~7.9 GB	14.3 s	×	北欧調の明るいデスクと壁ポスター 2 枚。ポスター文字は日本語の字形に寄ってはいるが完全幻覚、SDXL の日本語限界は変わらず
03_abstract_neural (抽象 + 中央空け)	~7.9 GB	12.9 s	△	紫青のニューラル網は美しいが、中央に主役のニューロン球体が居座って中央空けは実現せず (Ragnarok と同パターン)
04_comic_panel (マンガ調 + 「実測！」)	~7.9 GB	12.6 s	×	アニメ調のヘッドセット男 + マルチモニタ、cel-shaded は綺麗に描けたが吹き出し自体が描画されない。Jugg_XI が吹き出し形まで出した点で後退
05_iso_cityscape (アイソメ)	~7.9 GB	11.2 s	○	パステルピンク/紫のトーン一致、サーバーラック密度は Jugg_XI 同等、整然
06_poster_mixed (日英混在ポスター)	~7.9 GB	11.7 s	×	MacBook が中央に居座る構図、マゼンタ/シアンのネオングリッド背景は出るが、プロンプト指定の英字タイポ・日本語ともに未描画

実際の出力

結果のサマリ — Juggernaut との差分

○△× の比率: ○ 2 / △ 1 / × 3。Ragnarok / Jugg_XI の ○ 2 / △ 2 / × 2 から 1 つだけ × が増えた (04 で吹き出しが描画されない)
絵柄の傾向差: 01 はより写真的・ドキュメンタリー調 (Juggernaut のシネマティック寄りと違い、生活感のある実空間のトーン)。画面の表示内容は崩れ気味。”写実専門” のためか04 アニメ調や、05 のアイソメは細部が弱い。
速度: 1 枚あたり steady-state で 11 – 14 秒 (Jugg_XI ~33 秒 / Ragnarok ~40 秒)。同じ steps=30 / cfg=4.0 / dpmpp_2m / karras 条件で 2 – 3 倍速い。HF 配布の fp16 単一ファイルが UNet を 7.9 GB のまま VRAM 常駐させ、ComfyUI のオフロードが走らないことが効いている (Juggernaut 系では VRAM 占有が 1.3 – 11.6 GB に変動していたのと対照的)
コールドスタート: session 初回は 286.7 秒。これは SDXL UNet + VAE のロード + bake で、HF 配布の fp16 ファイルを ComfyUI が初めて触る場面のコスト。同じ Python セッション内 2 枚目以降は 11-14 秒に収束する
テキスト描画: 02 / 06 / 04 すべて崩壊。SDXL 横断で変わらず

「Juggernaut = SDXL 万能写実の到達点」「RealVisXL V5.0 = SDXL 写実専用の到達点 + 推論が速い」というキャラ分けが見えてきました。

強みを引き出す例 — 写実ポートレートで Juggernaut との差は出るか

RealVisXL の押し領域は HF README が明言するとおり 写実 (photorealism)。Juggernaut XL の押し領域 (写実ポートレート + 自然光) と完全に重なるので、敢えて Juggernaut Jugg_XI の 07/08/09 と同じプロンプト・同 seed で並べてみる のが本記事の比較です。

プロンプト	生成秒	結果	所見
07 クローズアップポートレート (肌・自然光)	70.7 s ※	○	※ session 初回。そばかすの粒子数と分布が Juggernaut より明らかに密、毛穴と肌のテクスチャは「肌診断器の写真」に近い生々しさ。陰影や明るさが自然で、”Real Vision” が押す領域そのまま
08 環境ポートレート (霧 + 逆光)	13.2 s	○	ゴールデンアワー + 霧 + ウールコート、人物が 1 人 (Jugg_XI で 2 人になったケースと違い指示通り)。霧のボリュメトリック光線も Juggernaut 同等
09 ドラマティック光線 (レンブラント)	17.8 s	○	老職人 + 暗部 + 工房、Juggernaut と比べてより「素の写真」寄り (Annie Leibovitz 的な絵画調ではなく、ドキュメンタリーの 1 シーン)。手のシワと工房の質感は同等

3 枚とも文句なしの ○。同じプロンプト・同 seed で並べると、Juggernaut のシネマティック (映画的演出寄り) と RealVisXL のドキュメンタリー (素の写真寄り) の絵作りの違い が明確に出ました。

07 の差: そばかすの粒子密度で RealVisXL > Juggernaut。”肌のリアルさ” を最優先するなら RealVisXL
08 の差: RealVisXL は人物 1 人、Jugg_XI は 2 人 (Ragnarok は 1 人)。同じプロンプト・同 seed でもファミリー間で構図解釈が変わる好例
09 の差: Juggernaut が「肖像写真家風」なのに対し、RealVisXL は「現場ドキュメンタリー風」。どちらが好みか次第

実用判断: アイキャッチ用途で写実そのものの “肌の毛穴・産毛・そばかす” を画面に乗せたいなら RealVisXL V5.0、ストーリーテリングのある写真表現なら Juggernaut、という棲み分けが妥当です。

棚での位置づけ — Juggernaut と RealVisXL の使い分け

用途	第一候補	理由
SDXL 系の “完成形” を 1 本選ぶなら	Juggernaut Ragnarok	farewell 作、SDXL ラインの締めくくり
Lightning 派生まで降りたい SDXL 系	Juggernaut Jugg_XI	公式に Lightning 派生がある最後の世代
写実そのものを掘りたい SDXL 系	RealVisXL V5.0	写実専門 merge、pareido.jp アイキャッチ実運用
日本語タイトル込み	ERNIE-Image-Turbo	多言語テキスト描画

Juggernaut が SDXL 万能写実の到達点、RealVisXL が SDXL 写実専用の到達点、という棚分けが自然です。日々のアイキャッチ用途で写実を掘りたいときは RealVisXL、構図やポーズが多彩な汎用シーンを描きたいときは Juggernaut、という使い分けになります。

次回予告

次回は RealVisXL V5.0 Lightning です。Juggernaut Jugg_XI Lightning と同じく Euler / sgm_uniform / cfg=1.0 / 4 step の連載統一 Lightning 条件で再走、本記事の通常版 30 step との品質トレードオフを確認します。写実専用モデルを 4-step まで蒸留したときに、写実の “肌の毛穴” は残るかが論点です。

安心して使える SDXL 写実派の現行最新版として RealVisXL V5.0 はそのまま使えるチェックポイント、というのが本記事の判定です。次回は同じ V5.0 系で速さを取った Lightning 派生を見ます。