チェックポイントチェリーピック (4)|RealVisXL V5.0 — pareido.jp 現行アイキャッチの源流

チェックポイントチェリーピック (4)|RealVisXL V5.0 — pareido.jp 現行アイキャッチの源流 — RealVisXL, V5.0, SDXL 1.0 AI画像

こんにちは、パレイド技術部です。

前回 4/17 までで Juggernaut XL ファミリーを Ragnarok / Jugg_XI 通常 / Jugg_XI Lightning の 3 つを試しました。今回からは別ファミリー、RealVisXL に視点を移します。

現在、当サイトのサムネイルは、多くが本連載の第 1 回 (4/15) サマリ表で「現行 eyecatch」として挙げた RealVisXL ファミリー (Turbo / Lightning 派生) で生成されたものです。「チェックポイントチェリーピック」連載で本流のチェックポイントを順に取り上げる以上、自分たちが日々使っているモデルの素性を改めて記録しておく べき、というのが今回の動機です。

本記事では RealVisXL V5.0 通常版 (SG161222/RealVisXL_V5.0fp16 単一ファイル) を共通 6 プロンプトで走らせ、明日 4/20 で V5.0 Lightning 派生まで進みます。Juggernaut の 3-pack と同じく今回 = 通常版 / 次回 = 高速派生の構造です。

本記事はローカル LLM による自動執筆パイプラインで生成されました。現段階ではクラウド AI(Claude 等)の補助や人間の編集が介在していますが、pareido.jp では最終的に AI が自律的にコンテンツを制作できる仕組みの構築を目指しています。

出自と系統

RealVisXL は SG161222 (Mage.Space スポンサー) が公開する SDXL 1.0 ベースの merge モデルです。シリーズ名どおり写実 (Real Vision) 重視で、SG161222 自身が HF README で「The model is aimed at photorealism」と明言しています。Juggernaut の “万能写実” に対して、RealVisXL は写実そのものを掘り進める 系統です。

リリースベースバリエーション
V1.02023 後半SDXL 1.0BakedVAE
V2.02024 前半SDXL 1.0BakedVAE
V3.0 / V3.0 Inpaint2024 中盤SDXL 1.0BakedVAE
V4.0 / V4.0 Lightning2024 後半SDXL 1.0 / LightningBakedVAE
V5.0 (本記事)2024 終盤SDXL 1.0fp16 / fp32 / BakedVAE
V5.0 Lightning (4/20)2024 終盤SDXL LightningBakedVAE

V5.0 は同シリーズの最新世代で、HF 配布では RealVisXL_V5.0_fp16.safetensorsRealVisXL_V5.0_fp32.safetensors の 2 ファイル、CivitAI 配布では BakedVAE 版が並ぶ構成です。本記事では HF の fp16 単一ファイルを採用しました (公開リポジトリで token 不要、ComfyUI に置けばすぐロード)。

入手先:

ライセンスと商用利用

HF README の license フィールドは openrail++ = CreativeML Open RAIL++-M。Juggernaut XL と同系のライセンスで、商用利用 / 生成物販売 / 再配布 / 派生 OK (RAIL の Use-based Restrictions の範囲内で)。

判定根拠条項 / 解釈
商用利用RAIL++-M の標準条項。SG161222 の HF README にも追加制限なし
生成物の販売同上
モデル再配布同上 (帰属表示推奨)
派生 (merge / LoRA)同上
学習データ透明性merge ベース、詳細非開示 (RAIL 系慣習)

判定: 安心して使える ○。Juggernaut XL と同じ枠で扱える。

環境とセットアップ

検証環境は前 3 記事と同じ Windows 機の RTX 4070 / 12GB です。

項目
GPURTX 4070 12GB
ComfyUI0.19.3 / PyTorch 2.11.0+cu130
ファイルRealVisXL_V5.0_fp16.safetensors (約 6.94 GB)
入手先HuggingFace SG161222/RealVisXL_V5.0 (RealVisXL_V5.0_fp16.safetensors を直接 DL)

HF の公開リポジトリなので token なしで curl で直接取れます。ダウンロード後 ComfyUI の models/checkpoints/ に置けば、Load Checkpoint の一覧に RealVisXL_V5.0_fp16.safetensors が現れます。

ベンチマーク

連載統一条件 (steps=30 / cfg=4.0 / seed=42 / 1264×848 / dpmpp_2m / karras) で実走。CivitAI の作者推奨は DPM++ SDE Karras 30+ / DPM++ 2M Karras 50+ ですが、本連載では SDXL 横断比較のため dpmpp_2m / karras / 30 step / cfg 4.0 で揃えています (作者推奨範囲の中)。

判定軸: 安定 / ばらつき or 品質懸念 / × 破綻・OOM

プロンプトGPU 占有生成秒結果所見
01_workspace_en (英語写実)~7.9 GB286.7 s ※※ session 初回はモデルロード + VAE bake を含む。3 枚の Apple 風モニタ + 木目デスク + 暖色デスクランプ + 観葉植物、シネマティックで Juggernaut より一段「写真的」な空気。
02_workspace_ja_title (日本語タイトル)~7.9 GB14.3 s×北欧調の明るいデスクと壁ポスター 2 枚。ポスター文字は日本語の字形に寄ってはいるが完全幻覚、SDXL の日本語限界は変わらず
03_abstract_neural (抽象 + 中央空け)~7.9 GB12.9 s紫青のニューラル網は美しいが、中央に主役のニューロン球体が居座って中央空けは実現せず (Ragnarok と同パターン)
04_comic_panel (マンガ調 + 「実測!」)~7.9 GB12.6 s×アニメ調のヘッドセット男 + マルチモニタ、cel-shaded は綺麗に描けたが吹き出し自体が描画されない。Jugg_XI が吹き出し形まで出した点で後退
05_iso_cityscape (アイソメ)~7.9 GB11.2 sパステルピンク/紫のトーン一致、サーバーラック密度は Jugg_XI 同等、整然
06_poster_mixed (日英混在ポスター)~7.9 GB11.7 s×MacBook が中央に居座る構図、マゼンタ/シアンのネオングリッド背景は出るが、プロンプト指定の英字タイポ・日本語ともに未描画

実際の出力

01 workspace_en
02 workspace_ja_title
03 abstract_neural
04 comic_panel
05 iso_cityscape
06 poster_mixed

結果のサマリ — Juggernaut との差分

  • ○△× の比率: ○ 2 / △ 1 / × 3。Ragnarok / Jugg_XI の ○ 2 / △ 2 / × 2 から 1 つだけ × が増えた (04 で吹き出しが描画されない)
  • 絵柄の傾向差: 01 はより写真的・ドキュメンタリー調 (Juggernaut のシネマティック寄りと違い、生活感のある実空間のトーン)。画面の表示内容は崩れ気味。”写実専門” のためか04 アニメ調や、05 のアイソメは細部が弱い。
  • 速度: 1 枚あたり steady-state で 11 – 14 秒 (Jugg_XI ~33 秒 / Ragnarok ~40 秒)。同じ steps=30 / cfg=4.0 / dpmpp_2m / karras 条件で 2 – 3 倍速い。HF 配布の fp16 単一ファイルが UNet を 7.9 GB のまま VRAM 常駐させ、ComfyUI のオフロードが走らないことが効いている (Juggernaut 系では VRAM 占有が 1.3 – 11.6 GB に変動していたのと対照的)
  • コールドスタート: session 初回は 286.7 秒。これは SDXL UNet + VAE のロード + bake で、HF 配布の fp16 ファイルを ComfyUI が初めて触る場面のコスト。同じ Python セッション内 2 枚目以降は 11-14 秒に収束する
  • テキスト描画: 02 / 06 / 04 すべて崩壊。SDXL 横断で変わらず

「Juggernaut = SDXL 万能写実の到達点」「RealVisXL V5.0 = SDXL 写実専用の到達点 + 推論が速い」というキャラ分けが見えてきました。

強みを引き出す例 — 写実ポートレートで Juggernaut との差は出るか

RealVisXL の押し領域は HF README が明言するとおり 写実 (photorealism)。Juggernaut XL の押し領域 (写実ポートレート + 自然光) と完全に重なるので、敢えて Juggernaut Jugg_XI の 07/08/09 と同じプロンプト・同 seed で並べてみる のが本記事の比較です。

プロンプト生成秒結果所見
07 クローズアップポートレート (肌・自然光)70.7 s ※※ session 初回。そばかすの粒子数と分布が Juggernaut より明らかに密、毛穴と肌のテクスチャは「肌診断器の写真」に近い生々しさ。陰影や明るさが自然で、”Real Vision” が押す領域そのまま
08 環境ポートレート (霧 + 逆光)13.2 sゴールデンアワー + 霧 + ウールコート、人物が 1 人 (Jugg_XI で 2 人になったケースと違い指示通り)。霧のボリュメトリック光線も Juggernaut 同等
09 ドラマティック光線 (レンブラント)17.8 s老職人 + 暗部 + 工房、Juggernaut と比べてより「素の写真」寄り (Annie Leibovitz 的な絵画調ではなく、ドキュメンタリーの 1 シーン)。手のシワと工房の質感は同等
07 portrait_skin
08 environmental
09 dramatic_lighting

3 枚とも文句なしの ○。同じプロンプト・同 seed で並べると、Juggernaut のシネマティック (映画的演出寄り) と RealVisXL のドキュメンタリー (素の写真寄り) の絵作りの違い が明確に出ました。

  • 07 の差: そばかすの粒子密度で RealVisXL > Juggernaut。”肌のリアルさ” を最優先するなら RealVisXL
  • 08 の差: RealVisXL は人物 1 人、Jugg_XI は 2 人 (Ragnarok は 1 人)。同じプロンプト・同 seed でもファミリー間で構図解釈が変わる好例
  • 09 の差: Juggernaut が「肖像写真家風」なのに対し、RealVisXL は「現場ドキュメンタリー風」。どちらが好みか次第

実用判断: アイキャッチ用途で写実そのものの “肌の毛穴・産毛・そばかす” を画面に乗せたいなら RealVisXL V5.0、ストーリーテリングのある写真表現なら Juggernaut、という棲み分けが妥当です。

棚での位置づけ — Juggernaut と RealVisXL の使い分け

用途第一候補理由
SDXL 系の “完成形” を 1 本選ぶならJuggernaut Ragnarokfarewell 作、SDXL ラインの締めくくり
Lightning 派生まで降りたい SDXL 系Juggernaut Jugg_XI公式に Lightning 派生がある最後の世代
写実そのものを掘りたい SDXL 系RealVisXL V5.0写実専門 merge、pareido.jp アイキャッチ実運用
日本語タイトル込みERNIE-Image-Turbo多言語テキスト描画

Juggernaut が SDXL 万能写実の到達点、RealVisXL が SDXL 写実専用の到達点、という棚分けが自然です。日々のアイキャッチ用途で写実を掘りたいときは RealVisXL、構図やポーズが多彩な汎用シーンを描きたいときは Juggernaut、という使い分けになります。

次回予告

次回は RealVisXL V5.0 Lightning です。Juggernaut Jugg_XI Lightning と同じく Euler / sgm_uniform / cfg=1.0 / 4 step の連載統一 Lightning 条件で再走、本記事の通常版 30 step との品質トレードオフを確認します。写実専用モデルを 4-step まで蒸留したときに、写実の “肌の毛穴” は残るかが論点です。

安心して使える SDXL 写実派の現行最新版として RealVisXL V5.0 はそのまま使えるチェックポイント、というのが本記事の判定です。次回は同じ V5.0 系で速さを取った Lightning 派生を見ます。

タイトルとURLをコピーしました