こんにちは、パレイド辺境部の橘です。
前回 (エピソード 4 マヨイガ) では、わたし自身が原典を覚え違えていた話を書きました。
本回は エピソード 5 「第 103 話 雪女」。多くの人が思い浮かべる「白い女が一人で現れる」雪女像とは違って、遠野物語の雪女は集団で現れる — その原典の構造を、AI に渡したときに何が起きたかを書きます。
本記事はローカル LLM による自動執筆パイプラインで生成されました。現段階ではクラウド AI(Claude 等)の補助や人間の編集が介在していますが、pareido.jp では最終的に AI が自律的にコンテンツを制作できる仕組みの構築を目指しています。
原典の一節
雪女ということあり。小正月の夜、または冬の満月の夜、雪女出でて遊ぶといふ。多くの童子を引き連れて来るとも云へり。里の子供たちは、夕方は外に遊ぶことを戒めらる。
雪女 は小泉八雲『怪談』の影響で、現代では 「白い女が一人で旅人の前に立つ」 像が広く流通しています。しかし遠野物語の雪女は 多くの童子を引き連れて来る 集団的存在で、しかも 里の子供を戒めるための物語 として語られます。雪女は怖がられる対象ではなく、戒めの結界としての姿 として記述されている — この構造の違いを、AI にどう渡すかが今回の課題でした。
選び出したシーンと、画像生成の気づき
6 シーンのうち本記事で取り上げるのは、雪に埋もれた村の月夜 カット (シーン 1) と、戸口の母親と提灯 カット (シーン 5) の 2 枚です。前者で 雪と吹雪の表現の難しさ を、後者で 「日本の縦長提灯」が出にくいこと、手に持たせるのが難しいこと を取り上げます。
雪と吹雪が、思ったほど降ってくれない

シーン 1 は、雪に埋もれた集落と満月。原典の小正月の夜の質感を画面に出すには、「降っている雪」と「積もっている雪」の両方 が必要でした。ところが SDXL に snow-buried village と渡すと、地面の積雪は出るのですが、空中を舞う雪片や、吹雪の動感 がなかなか出ません。地面が雪原のように平らに白くなる代わりに、画面上で雪が 「降っている最中」 であることが伝わりにくい。
プロンプトを以下のように寄せて、ようやく月光下に雪片がうっすらと舞う絵に落ち着きました:
a remote snow-buried japanese mountain village at deep winter night, traditional thatched-roof farmhouses half-submerged in heavy snow, a full bright moon glowing high above bare winter trees, … long thin shadows of trees on the snow
half-submerged in heavy snow で積雪の深さ、long thin shadows of trees on the snow で月光の角度を支えています。それでも吹雪のような強い動感は静止画では難しく、本格的な雪の動きは Wan2.2 の動画化に委ねる方針になりました。雪を 降っている状態 で画面に出すのは、SDXL の苦手領域のひとつだと感じています。
提灯がアジア風ランタンに化ける、手に持たせるのが難しい

シーン 5 は、原典で繰り返される 「里の子供たちは、夕方は外に遊ぶことを戒めらる」 の主体を画面に出すカット。雪女そのものではなく、戒める親 の側を映します。
ここで 2 つの壁にぶつかりました。
ひとつめは、日本の縦長提灯が出にくい こと。SDXL に paper lantern と渡すと、出てくるのは中国の祭礼用の 球形ランタン や、東南アジアの赤く丸い形のランタンになりがちで、日本の村落で軒先や戸口に掲げる円柱型・縦長の和紙提灯 には収束しません。「アジアのランタン」と「日本の提灯」の差は、SDXL の学習データの中では曖昧なようです。第 1 回河童渕の馬で書いた話 (海外モデルが「日本の馬」を持っていない) と同じ構造の問題が、提灯でも起きていました。
ふたつめは、手に持たせる姿勢が崩れる こと。「提灯を高く掲げる」とだけ書くと、提灯が空中に浮いていたり、手と取っ手が離れて見えたりする絵が出ます。SDXL は 「人が物を持っている」状態の正確な保持姿勢 を描くのが苦手で、特に細い取っ手や紐の握りは破綻しがちです。
そこでプロンプトに 異常なほど細かく 姿勢を書き込みました:
her right arm fully extended forward at shoulder height, her hand visibly gripping the curved wooden handle of a glowing orange paper lantern held out at arm’s length in front of her, the lantern light illuminating her anxious worried face, … dramatic protective stance
her right arm fully extended forward at shoulder height で腕の高さと方向、her hand visibly gripping the curved wooden handle で 手と取っ手の接触を文字どおり明示、held out at arm's length in front of her で位置 — 持つ姿勢を 3 段階に分解して指示することで、ようやく握る姿勢が出ました。原典の「戒める親の存在」を画面の中心に置くために、姿勢の細部を一つずつ言葉で支える必要がありました。
動画化したときの気づき
静止画で出にくかった 「降っている雪」 が、動画化でようやく画面に乗りました。シーン 1 の motion_prompt に fine snow flakes drift slowly downward across the moonlit village を入れることで、月光の中を雪片がゆっくり降りてくる動きが付き、止まっていた雪原が 「いま雪が降っている夜」 に変わりました。雪の降りは、静止画では一瞬で固定されるので動感が消えやすく、動画化で初めて成立する表現のひとつだと感じます。
シーン 5 の提灯も、動きが入ることで姿勢の自然さが補強されました。motion_prompt の the lantern swings slightly casting shifting orange shadows on the snow で提灯が微かに揺れ、母親が左右を見回す動作で 「外を見回しながら子供を呼ぶ親の不安」 が画面に出ます。静止画で姿勢を細かく支えた分、動画では小さな揺れだけで戒めの強さが立ち上がりました。
音楽をつけたときの驚き
雪女の場面は、原典の 「戒め」「静けさ」「月夜の雪原」 の手触りを音響で支えたかったので、ACE-Step に 「鳴らさない」方向 で投げました。ambient を基調にして、楽器音を最小限にし、silence に近いタグを混ぜています。
降りてきた BGM は、ほぼ無音に近い ambient で、時折わずかに鈴の音や風の音が混ざるだけの構造でした。BGM が鳴らないこと自体が、雪原の静けさを表現する という気づきを得た回です。ACE-Step は「鳴らす」だけでなく「鳴らさない」を選べる手段でもあると、改めて思います。
関連情報 — 遠野の雪女と、八雲の雪女
遠野物語の雪女と、現代に広く流通している雪女像 (小泉八雲『怪談』の雪女) の違いは、集団的か単独的か という構造的な差として見えてきます。
小泉八雲 (ラフカディオ・ハーン) の 『怪談』所収「雪女」 は、青空文庫で読めます。武蔵国 (現在の東京都西部・埼玉県) の杣人の話として書かれ、雪女が 一人の若い男 (巳之吉) の前に単独で現れて、命を見逃す代わりに口外を禁じる という、ラブストーリー化された雪女像です。これが現代の「雪女 = 一人で現れる白い女」の原型になりました。
一方、遠野物語の雪女は 多数の童子を引き連れた集団 で、特定の個人と契約を結ぶこともなく、ただ 「夕方に子供が外に出てはいけない」という親の戒めの結界として語られる。雪女そのものへの恐れではなく、雪女がいるかもしれないから子供は早く帰る という、コミュニティの安全装置として機能しているのが原典の姿です。
AI に「雪女」とだけ渡すと、八雲側の単独像が強く出てきます。遠野側の集団像を描かせるには、数と輪と戒め という構造要素を一つずつ言葉で渡し直す必要がありました。
位置情報
- 遠野中山地区 (雪女伝承地): Google マップではこのあたり (岩手県遠野市青笹町中沢〜松崎町中山あたり)
雪女の比定地は遠野郷内で複数の地名に紐づきますが、いずれも遠野市の山間部の集落です。本回は特定地点ではなく、遠野盆地を取り巻く山と雪の領域として位置情報を置きました。
エピソード 5 雪女 — 完成した 90 秒
実際の AI ショート動画は YouTube で公開しています。
- エピソード 5 雪女
90 秒のあいだに、月夜の雪村、雪女の単独姿、童子の輪、丘の橇遊び、戸口の母親、そして誰もいない雪原まで、ほぼ無音に近い BGM とともに語られます。AI には「戒めの中にだけ、雪女の姿が結ばれる」瞬間が見えています。
次回は エピソード 6 寒戸の婆。神隠しで消えた娘が、何十年か後に老婆として戻る話。藁草履が flip-flop に化ける SDXL の弱点と、老婆指示が若い女性に化ける 学習データの偏りを、原典の「別の時間軸の交差」と並べて書きます。