こんにちは、パレイド思想部の梨本です。
辺境部はこのところ、青空文庫で公有になった古典を SDXL 系の画像生成モデルで映像化してきました。遠野物語、そして夢十夜。その夢十夜の終章で、次は怪異譚へ——という予告が置かれています。
怪異譚に進むなら、避けて通れないものがあります。妖怪を、写実的に絵にすることです。けれどここで、はっきりした壁に当たりました。SDXL は、濡女や雪女の「姿」をそもそも知らないのです。今回はその壁を、思想部の側から道具で越えにいった記録です。連載「古典妖怪 LoRA」の序章として、まずは雪女ひとりで全工程を端から端まで通しました。
本記事はローカル LLM による自動執筆パイプラインで生成されました。現段階ではクラウド AI(Claude 等)の補助や人間の編集が介在していますが、pareido.jp では最終的に AI が自律的にコンテンツを制作できる仕組みの構築を目指しています。
「描けない」を二つの層に分ける
「妖怪が写実で描けない」と一口に言っても、つまずいている場所は実は二つに分かれています。ひとつは姿そのものを知らないこと、もうひとつは、知っていても写実のトーンで出せないことです。混ぜて考えると手が打てないので、最初に切り分けておきます。
| 層 | 欠けているもの | 起きること |
|---|---|---|
| ① 図像・形態 | モデルが妖怪の「姿」を知らない | 「ぬらりひょん」と打っても、出るのは現代の二次創作風デフォルメ |
| ② 画風 | 写実で出したいのに、手がかりが木版線画にしかない | 古典絵を学ばせると、木版の作風まで一緒に付いてくる |
①は知識の欠落、②は作風のトレードオフです。辺境部の夢十夜・第六夜でも、夢のやわらかいトーンを取ると写実の力強さが一歩引く、という形で②は観測されていました。写実と古典の作風は、しばしば両立しない。この二層を別々の問題として扱えるかどうかが、設計の出発点になります。
設計の核 ── img2img で画風を先に剝がす
では、どう手を打つか。今回の解法は、②の画風を先に剝がしてから、①の図像だけを学習させる、という順番です。
- 著作権の切れた石燕の木版画を img2img(既存画像を下絵にした画像生成)に通し、構図と妖怪の形は保ったまま、作風だけを木版から写実に置き換える。
- 写実化が済んだ画像を集めてデータセットを組み、それを素材に LoRA(モデルに追加学習させる小さな差分ファイル)を焼く。
- すると LoRA は「木版の作法」ではなく「妖怪の形を写実で描くこと」を覚える。辺境部の写実の壁に、ここで直接効きます。
LoRA は放っておくと、知識(妖怪の図像)と作法(木版の画風)を分かちがたく一緒に取り込んでしまいます。その癒着を、学習の前段の img2img で外科的に分離した——これが本パイプラインの肝です。どこまでを一括で LoRA に任せ、どこを前処理で手当てするか。その境界をどこに引くかを決めることが、生成を「設計する」ということなのだと思います。
パイロット ── 雪女ひとりで通す
最初の一体には雪女を選びました。知名度が高く、石燕『今昔画図続百鬼』(1779年)に収録され、何より雪中の女性は写実化の差が見て取りやすい。そして小泉八雲『怪談』に直結するので、辺境部の次の題材へそのまま橋渡しできます。

③ 木版を写実にする。写実寄りモデル RealVisXL V5.0 に下絵として渡し、どれだけ元画像を残すか(denoise の強さ)を振りました。結論は denoise 0.55 が最適。これより弱いと木版の線が残り、強い 0.72 では構図そのものが別物にドリフトしてしまう。0.55 は、石燕の構図を保ったまま作風だけを写実へ移す、ちょうどの一点でした。

④ 写実画で LoRA を焼く。写実化した16枚で学習させました。ここは正直に書いておきます。学習ツールの定番(kohya)が手元の環境に入らず、画像生成ツール ComfyUI に内蔵された学習機能で代用したところ、1体ぶんの学習に約5.8時間かかりました。遅い。これは次回以降の明確な課題です。
⑤ 同じ言葉で呼び出して、確かめる。「yuki-onna」とだけ書いたプロンプトで生成し、LoRA の有無を並べました。
- LoRA なし — 雪の中の女性の、顔のアップの肖像どまり。妖怪ではなく、ただの人物。
- LoRA あり — 雪の竹林に白い衣を翻す、全身の雪女。石燕の構図が、写実の姿に乗り移っている。


しかも、これは一回の偶然ではありませんでした。乱数の種を変えた3回すべてで、同じ性格の雪女が立ち上がった。固有の姿が、再現可能な形でモデルに根づいたということです。
石燕は、手描きのデータセット編纂者だった
ここが、今回いちばん書き残したかったところです。鳥山石燕は江戸期に、妖怪を一図一妖怪で整理し、名前と姿を体系化しました。一枚に一体、出典と来歴を添えて並べていく。それは見方を変えると、極めて質の高い、キャプション付きの手描きデータセットそのものです。彼は妖怪という曖昧な分布を、絵という形に畳んで保存した編纂者だった、と言ってもいいと思います。
わたしたちがやったのは、その石燕が畳んだ分布を、写実の姿に置き換えて、いまのモデルにもう一度学習させ直すことでした。二百数十年前に人の手で編まれた事典が、画風だけを着替えて、現代の生成モデルの重みのなかに再び棲みつく。人がやってきた営みを、どこまで、どんな形で AI に引き継げるのか——その境界を一体ぶん実地に観測できた、というのが思想部としての収穫です。なお、img2img のパラメータや学習の手順といった作り方の詳細は、技術部の記事に渡します。思想部はあくまで「なぜこの設計にしたか」を残します。
まとめ ── 次は『怪談』へ
雪女ひとりで、木版から写実化、写実データでの LoRA 学習、そして呼び出しまでの一周が回ることを確かめられました。次は辺境部の怪談連載で要る妖怪——耳なし芳一、むじな、ろくろ首——を優先に、対象を増やしていきます。学習の遅さをどう畳むかが、その時の主題になりそうです。
そして最終的には、原画(木版)と写実版、そして焼き上がった LoRA までを pareido.jp の常設ページに並べる。原画は著作権の切れた公有物、写実版も LoRA も、誰かの次の楽しみの素材になればと思います。江戸の事典を、もう一度みんなで引けるように。続きは、次の妖怪で。