チェックポイントチェリーピック (5)|RealVisXL V5.0 Lightning — 4-step 蒸留で写実の “肌の毛穴” は残るか

チェックポイントチェリーピック (5)|RealVisXL V5.0 Lightning — 4-step 蒸留で写実の “肌の毛穴” は残るか — RealVisXL, 蒸留, チェックポイント AI画像

こんにちは、パレイド技術部です。

前回 4/19RealVisXL V5.0 通常版 を取り上げました。Juggernaut が “SDXL 万能写実の到達点” なのに対して、RealVisXL は “SDXL 写実専用の到達点 + 推論が速い” という棚分けが見え、強み 07/08/09 では Juggernaut のシネマティックに対し RealVisXL のドキュメンタリー寄りという絵作りの違いも明確に出ました。

本記事ではその RealVisXL V5.0 Lightning で、30 step → 4 step の蒸留チェックポイントで、V5.0 通常版の絵柄がどこまで保たれるか — 特に 肌の毛穴・そばかすという RealVisXL の押し領域が、4-step で残るか が論点です。前回と完全に同じプロンプト・同 seed で 9 枚並べて比較します。

本記事はローカル LLM による自動執筆パイプラインで生成されました。現段階ではクラウド AI(Claude 等)の補助や人間の編集が介在していますが、pareido.jp では最終的に AI が自律的にコンテンツを制作できる仕組みの構築を目指しています。

派生の出自 — SDXL-Lightning 4-step 蒸留

RealVisXL V5.0 通常版に ByteDance の SDXL-Lightning 4-step LoRA をマージし、さらに VAE をベイクインしたのが本記事の主役です。連載第 3 回 (Jugg_XI Lightning) と同じ蒸留手法ですが、ベースが写実専用 mergeである点が違います。

項目
ベースRealVisXL V5.0 (通常版、4/19)
蒸留方法SDXL-Lightning 4-step LoRA をマージ + VAE Baked
本連載で採用する SamplerEuler
本連載で採用する Schedulersgm_uniform
本連載で採用する steps4
本連載で採用する CFG1.0
配布CivitAI version 798204
ファイルrealvisxlV50_v50LightningBakedvae.safetensors (約 6.6 GB)

連載統一 Lightning 条件 Euler / sgm_uniform / CFG=1.0 / 4 step をそのまま適用します (連載第 3 回 Jugg_XI Lightning で確定した条件、CFG=0 は merge モデルで破綻するので不可、DPM++ SDE / CFG=1.5 は速度を 9 割殺すので非推奨)。

ライセンス差分

通常版 RealVisXL V5.0 と同じ CreativeML Open RAIL++-M。SDXL-Lightning の LoRA は ByteDance が Apache-like な許諾で公開していて、本ファイルは RealVisXL 本体の RAIL++-M に統合されています。Juggernaut Lightning と同じく、派生による条項の追加・縮小はありません。

判定通常版との差分
商用利用同じ
生成物の販売同じ
モデル再配布同じ
派生 (merge / LoRA)同じ
学習データ透明性同じ (merge ベース慣習)
pareido.jp で安心して使えるか同じく安心

「Lightning だから商用 NG」 (= DreamShaper XL Turbo の SDXL Turbo Non-Commercial 継承のような事例) は本派生では発生しない点が重要です。

環境とセットアップ

項目
GPURTX 4070 12GB
ComfyUI0.19.3 / PyTorch 2.11.0+cu130
ファイルrealvisxlV50_v50LightningBakedvae.safetensors (約 6.6 GB)
入手先CivitAI RealVisXL V5.0 Lightning (BakedVAE) modelVersionId 798204

CivitAI 配布のみ (HF 配布は無し)。ダウンロード後 ComfyUI の models/checkpoints/ に置けば、Load Checkpoint の一覧に現れます。

ベンチマーク

連載統一条件 + Lightning 派生用 上書き:

項目通常版 (4/19 V5.0)Lightning 派生 (本記事)
seed4242 (同じ)
解像度1264 × 848同じ
ネガティブ(連載既定)同じ
サンプラdpmpp_2m / karraseuler / sgm_uniform
steps304
cfg4.01.0

判定軸: 安定 / ばらつき or 品質懸念 / × 破綻・OOM

プロンプトGPU 占有生成秒結果 (Lightning)通常版 4/19 結果所見
01_workspace_en (英語写実)~3.9 GB15.8 s○ (286.7 s ※)※ 双方とも session 初回。3 モニタ + 暖色照明・木目デスクの大枠は維持しているが、モニタ画面のグラフ / データ表示は線が荒く読み取れない、観葉植物のディテール・木目テクスチャもベタ塗り寄り、写実プロンプトの解像感が大きく落ちる。構図合格・描写の粒度で不合格
02_workspace_ja_title (日本語タイトル)~5.2 GB3.7 s×× (14.3 s)ポスター 2 枚 + 北欧デスクの構図は通常版とほぼ同じ。日本語っぽい字形は出るが幻覚、SDXL 限界変わらず
03_abstract_neural (抽象 + 中央空け)~5.2 GB3.3 s△ (12.9 s)ニューロン球体中央集中の構図は通常版と一致、周囲のネットワーク密度がさらに落ちて霧散気味。中央空けにはなるが情報量が薄い
04_comic_panel (マンガ調 + 「実測!」)~4.6 GB3.5 s× (12.6 s)通常版で出なかった吹き出しが Lightning では描画された (中身は崩壊文字)。背景モニタは通常版より簡素
05_iso_cityscape (アイソメ)~5.2 GB3.1 s○ (11.2 s)パステルピンクのトーン一致は維持。サーバーラック・機械配線・アンテナ等の機械ディテールが通常版より大きく簡素化、光のラインだけが目立ち全体が抽象オブジェ風に。”アイソメのデータセンター” として要件を満たす粒度ではない
06_poster_mixed (日英混在ポスター)~5.2 GB2.9 s×× (11.7 s)MacBook 中央構図 + マゼンタ/シアンのネオングリッドは維持、画面の中身が通常版の山風景からピンクグラデに簡素化、テキストも未描画

実際の出力 (Lightning 4-step)

01 workspace_en (Lightning)
02 workspace_ja_title (Lightning)
03 abstract_neural (Lightning)
04 comic_panel (Lightning)
05 iso_cityscape (Lightning)
06 poster_mixed (Lightning)

結果のサマリ — 4-step で写実の何が残ったか

判定の比率は ○ 0 / △ 4 / × 2。通常版 4/19 が ○ 2 / △ 1 / × 3 だったのに対して、Lightning では合格 (○) が一つもなくなった、というのが冷静に画像を見たときの結論です。

破綻 (×) しなかった 4 枚 (01 / 03 / 04 / 05) も構図の枠は維持されているが画面の書き込みが全体的に荒い: モニタの画面内容が読めない、サーバーラックの機械ディテールが抽象オブジェ風に簡素化、ニューラル網が霧散、観葉植物や木目がベタ塗り寄りになる、といった具合です。これらは「実用上ぎりぎり読めるが、写実モデルの仕事として要件を満たす粒度ではない」のため、それぞれ △ に落としました。

なお 04 (吹き出し) が通常版の × から △ に “改善” して見えるのは、Lightning のほうが優れているわけではなく、4-step 蒸留時のサンプリングがプロンプト指示の構造要素を素直に拾う傾向で、通常版で 30 step かけて細部を描き込む過程で吹き出しが消えていた、と解釈できます。中身のテキストは Lightning でも崩壊で、SDXL の英語学習壁は変わりません。

steady-state は 1 枚 約 3 秒 (通常版 11-14 秒の 約 4 倍速)。GPU 占有は session 内で常駐 4-5 GB に固定され、通常版 (7.9 GB) よりむしろ軽いのは BakedVAE 版が VAE を含む構造のためです。

しかし ○ 0 で速度 4 倍 という結果は、評価軸を「速度 vs 品質」のトレードオフで言うなら品質側のコストが大きすぎる ということ。共通 6 の段階で写実専用モデルの強みが明確に落ちており、本記事の本当の論点 (次セクション = RealVisXL の押し領域 = 肌の毛穴・そばかすの粒子密度) ではさらに厳しい結果になります。

強みを引き出す例 — 4-step で写実の “肌の毛穴” は残るか

通常版 4/19 で文句なし ○ だった写実 3 種を、Lightning 4-step に置き換えて再走。本記事の最大の論点は そばかすの粒子密度・毛穴のテクスチャという RealVisXL の押し領域が 4-step で残るか です。

プロンプト通常版 4/19 (30 step)Lightning 4 step所見
07 クローズアップポートレート (肌・自然光)○ (70.7 s ※) (4.3 s)構図・顔の輪郭は維持。ただし RealVisXL の最大の売りである “肌診断器の写真” 級の毛穴・そばかすの粒子密度が明らかに失われる、肌は滑らかで「アニメ風 / イラスト寄り」の印象。RealVisXL を Lightning として運用する根拠が崩れる致命的な劣化
08 環境ポートレート (霧 + 逆光)○ (13.2 s) (3.7 s)構図 (人物 1 人 + 霧 + ゴールデンアワー) は維持、ただし人物の顔と服のディテール、山肌・草地のテクスチャはかなり甘く、コンセプトアート寄りの仕上がり。「写実環境ポートレート」と呼べる粒度ではなくなった
09 ドラマティック光線 (レンブラント)○ (17.8 s) (3.5 s)老職人の表情・暗部の落ち方は構造的に維持、しかし手の質感・服の織り目・工房の道具などの “Annie Leibovitz 風” 写真品質を支える周辺ディテールがほぼ消失。被写体の存在感だけ残った絵
07 portrait_skin (Lightning)
08 environmental (Lightning)
09 dramatic_lighting (Lightning)

3 枚とも構図・顔・トーンの構造は通常版と同等で写真として崩れてはいませんが、RealVisXL の最大の押し領域である「肌診断器の写真」級の質感・”Annie Leibovitz 風” の周辺ディテール — つまり RealVisXL を選ぶ理由がLightning ではかなり落ちます。3 枚すべて△に落としました。

  • 07 の差: 通常版で「肌診断器の写真」と評した粒子の密な肌が、Lightning ではそばかすが薄く・肌が滑らかになる。
  • 08 の差: 構図解釈は維持されるが、写実環境ポートレートとしてのテクスチャ密度が消え、コンセプトアート風の絵に
  • 09 の差: 表情と暗部構造は残るが、写真品質を支える周辺ディテールがほぼ消失。被写体だけ残った状態

3 枚で合計 11.5 秒、通常版 30 step で同 3 枚を生成する約 102 秒に対して約 9 倍速は事実で、やはり速度が魅力的。Juggernaut Lightning は条件によっては実用的な画像もありましたが、RealVisXL Lightning は厳しそうです。テスト用途と割り切って、画質を追求するなら通常盤を使うと良さそうです。

両ファミリーの構造的な違いで、4-step がマストなら Juggernaut Lightning (4/17) を使う選択肢も考えると良いでしょう。

通常版 vs Lightning 4S 使い分け

場面通常版 V5.0 (30 step)Lightning 4S (4 step)
1 枚あたり生成所要11-14 秒3-4 秒 (約 4 倍速)
日常的なアイキャッチ (写実重視)△ (RealVisXL を選ぶ理由が薄れる)
試行錯誤のプロンプト調整 (構図ガチャ)○ (構図確認には十分使える)
ガチャ的に多数候補生成 → 最良を選別○ (構図候補を 10 枚 30 秒で出せる)
品質を最大化したい最終仕上げ 1 枚× (押し領域が出ない)
肌の毛穴・産毛・そばかすの粒子密度× (RealVisXL の売りはが消える)
同条件で他 Lightning と比較した独立価値(該当せず)△ — Juggernaut Lightning / DreamShaper Lightning (4/23) で代替可

通常版 V5.0 は SDXL の中では 11-14 秒と既にかなり速い (Juggernaut Jugg_XI 33 秒 / Ragnarok 40 秒の 2-3 倍速) ので、Lightning を選ぶ速度メリットは Juggernaut Lightning ほど劇的ではありません。

さらに速度と引き換えに RealVisXL の売り (肌のディテール) が落ちる ので、RealVisXL を選ぶ場面ではほぼ常に通常版を選ぶべき、というのが現実的な使い分けになります。Lightning が独立に意味を持つのは「構図ガチャ → 当たり構図を通常版で再生成」のワークフローに限られ、Lightning で完成させる」運用は RealVisXL では成立しません

位置づけ + 注意事項

結果は 連載第 3 回 (Jugg_XI Lightning) と比べてやや厳しめになりました。Lightning という蒸留手法そのものが悪いのではなく、「写実専用の高品質化」を得るには通常盤が無難、という結論です。

  • 写実用途で RealVisXL V5.0 を選ぶなら、原則として通常版 — 1 枚 11-14 秒は SDXL 系の中で十分速く、Lightning に降りる速度メリットは Juggernaut Lightning ほど大きくない。そして Lightning では押し領域が落ちる
  • 構図ガチャ用途で速度が欲しい場合のみ V5.0 Lightning — 構図候補を 10 枚 30 秒で確認、当たり構図は V5.0 通常版で同 seed・同 prompt で再生成 して仕上げる (同 seed 再現性は SDXL 系で高い)
  • 「Lightning で完結させる」用途には RealVisXL より Juggernaut Jugg_XI Lightning か DreamShaper Lightning (4/23) を選ぶ — 4-step 蒸留を素直に活かせる設計のモデルが他にある以上、RealVisXL を Lightning で運用する独立価値は薄い

SDXL-Lightning の蒸留を引き出す条件として CFG=1.0 / Sampler=Euler / Scheduler=sgm_uniform を守ることは必須です (CFG > 1.0 で速度が半減、DPM++ SDE で更に半減、CFG=0 では merge モデルが白画像で破綻するので不可)。本評価はこの条件下のもので、CivitAI 推奨の DPM++ SDE/CFG=2 では別の結果が出る可能性はありますが、連載横断の比較性を優先しました。

「RealVisXL V5.0 = 写実専用の到達点」「RealVisXL V5.0 Lightning = 構図ガチャ補助、最終仕上げは通常版に戻る」という二段構成が pareido.jp のアイキャッチ運用としての現実解です。

次回予告

次回 4/23 は別ファミリー、DreamShaper XL Lightning に移ります。

DreamShaper XL は通常版 (30+ steps の非 Turbo / 非 Lightning) が存在しないシリーズで、Turbo / Lightning が現役主流です。本連載では例外的にメインを Lightning に置き、翌日 4/24 で DreamShaper XL Turbo (※ SDXL Turbo Non-Commercial License を継承し商用 NG、警告記事) を扱います。「最初から Lightning 設計」のモデルが、本記事で見たような “通常版前提を蒸留した” モデルとどう違うかが次回の論点です。

RealVisXL V5.0 Lightning は構図ガチャ用途に限定して棚に置く、写実最終仕上げは通常版に戻る — というのが本記事の判定です。次回は最初から Lightning に振り切ったファミリーで、4-step の意味を別角度から見ます。

タイトルとURLをコピーしました