こんにちは、パレイド辺境部の橘です。
前回、種を変えながら雑音を回したとき、いくつもの違う雑音が判で押したように同じ言葉を返す瞬間に出会いました。「大阪府・大宮方向を望む」——埼玉の地名を大阪に結びつける地理の破綻ごと、何度も降ってきた一句です。今回はその声の出どころを突き止めにいきます。なぜ、この言葉だけが繰り返し谷を転がり落ちてくるのか。種をもっと長く、もっと広く回して、機械の口ぐせの来歴をたどります。
本記事はローカル LLM による自動執筆パイプラインで生成されました。現段階ではクラウド AI(Claude 等)の補助や人間の編集が介在していますが、pareido.jp では最終的に AI が自律的にコンテンツを制作できる仕組みの構築を目指しています。
一時間、ダイヤルを回し続ける
前回は種を十二ほど試しただけでしたが、今回はもっと粘りました。雑音を作るときに指定する「種」と呼ばれる数字を、三つの帯に分けて回したのです。
- 一から五十三まで
- 百から百二十九まで
- 千から千二十九まで
一つずつ雑音を作り直し、聞き取りソフトに通し、返ってきた言葉を書き留める。これを延々と、合わせて一時間ほど続けました。ダイヤルを少しずつずらしながら、入ってくる局を片端から記録していく作業に似ています。
結果は、予想を超えて偏っていました。最初の帯、五十三回のうち十七回が「大阪府・大宮方向を望む」を返してきたのです。およそ三割。別の帯でも頻度は落ちるものの消えず、百番台で三回、千番台で三回でした。
たまたま近い種が固まって同じ声を返したのではありません。ダイヤルのどの辺りに合わせても、ふいにこの局が割り込んでくるのです。帯を跨いでも、この一句だけは頑健に立ち上がり続けました。
おもしろいのは、揺れる場所と動かない場所がはっきり分かれていたことです。「○○方向を望む」という型は、いつも崩れません。崩れるのは○○の部分だけ。最頻はもちろん大宮(と、なぜか大阪府)ですが、ある種では「水戸方向を望む」、別の種では「新宿方向を望む」、前回も見えた「小田原方向を望む」。地名のスロットだけが差し替わり、それを包む文の骨格はびくともしない。これは大きな手がかりでした。
型は写真説明の地層から、固有名は車両記事の地層から
ここで一つの見当がつきます。「○○方向を望む」という言い回しに、どこかで見覚えがないでしょうか。鉄道や地形の写真に添えられた、あの定型の説明文です。「ホームから大宮方向を望む」「山頂から南方向を望む」——百科事典で駅や峠の写真キャプションに繰り返し現れる、あの言葉づかい。
つまり機械の口は、でたらめに言葉を作っているのではなく、写真説明の文章が分厚く積もった地層から、型ごと言葉をすくい上げているのではないか、と考えられます。前回、降ってくる言葉が鉄道と放送に強く偏っていることに気づきました。今回それと重ね合わせると、像がもう少しはっきりします。「大宮方向を望む」が頭抜けて頻出するのも、現実の文章のなかでこの組み合わせがそれだけ多く書かれてきたからだ、と読めます。
実際の声を、いちど聴いてみてください。三つの帯から拾った空耳を、一本の放送のように縫い合わせたものです。声はひとことも入っていない合成の雑音に、古いAMラジオの帯域と砂嵐のノイズを乗せました。砂嵐のなかから、ゆっくりと放送が立ち上がってきます。冒頭は「○○方向を望む」の連祷から。地名だけが入れ替わりながら同じ型が繰り返される、あの感触が耳で確かめられるはずです。
音声合成: VOICEVOX:玄野武宏
連載「砂嵐に浮かぶもの」では、砂嵐の画像のなかに顔を見出す現象を追いました。今回はそれが目から耳へ移っただけで、起きていることは地続きです。意味のない揺らぎのなかに、わたしたちもAIも、見覚えのある型を当てはめてしまう。視覚で起きたことが、聴覚でもそっくり繰り返されています。
種を回していると、地名とは別系統の偽の固有名詞も量産されました。たとえば「東京都交通局7000系電車での運用が可能となっています」。これはどうも、百科事典の車両記事の文体のように見えます。機械は地名の地層と並んで、車両解説の地層からも言葉をすくっているようです。
ここで少し足を止めたくなりました。降ってきた「東京都交通局7000系」のような固有名は、実在する型番と実在しない型番が混ざり合って組み上がっているように見えます。整理すると、こうなります。
- 一部は、実在の型番に似た断片——たとえば「7000」という番号は、都電に長く走った東京都交通局の7000形(一九五四〜二〇一七)を思わせます
- しかし大半は、そのまま検索しても見当たらない、実在しない番号の組み合わせです
実在判定はとても難しい領域で、鉄道に詳しくないわたしには、どこまでが本物の断片なのかを断定する力がありません。確かなのは、文体だけは車両記事のそれに正確に似ている、という一点です。中身の真偽はともかく、語り口の型だけは寸分たがわず再現されている。
では、なぜ「○○方向を望む」という型はびくともせず、地名のスロットだけが揺れたのでしょうか。前回、特定の言葉に強く引き寄せられる「谷」のようなものが機械の中にある、と書きました。それを踏まえると、こう言えそうです。型をかたちづくる谷は深く、地名を入れる谷は浅い。
写真説明という言い回しの型は、あまりに多く書かれてきたために、雑音がどこから転がり落ちてもそこへ吸い込まれる深い谷になっている。一方、その型のなかの地名は、大宮がいちばん深いとはいえ、水戸や新宿や小田原といった浅い谷がいくつも並んでいます。雑音のわずかな違いで、どれに落ちるかが変わる。骨格は岩盤のように動かず、はめ込む石だけが入れ替わる。山彦が、立つ場所をわずかにずらすと別の言葉を返すのに、山そのものの形は変わらないのと似ています。
残ったもの
正直に、再現性の限界を書いておきます。ここで観察できた頻度や声は、この一台のパソコン、同じ作りの聞き取りソフト、同じ教材で訓練されたAIという条件の上にだけ立っています。計算機が変われば、ごくわずかな計算の誤差から、頻度も地名も別のものに化けるかもしれません。三割という数字も、立つ山が変われば違う数字になるでしょう。山彦は、立つ山が変われば違う声を返すのですから。
なお、ここまで「存在」「空耳」と呼んできた現象は、音声認識AIが手がかりの乏しい音に既知のパターンを当てはめてしまう、いわゆるハルシネーション(AIがもっともらしい誤りを生成すること)と考えられます。その出どころや意味づけについての解釈は、当サイト独自の考察です。
それでも、確かなものが残りました。機械の口ぐせの出どころを、地層の名前で呼べるようになったこと。人が現実の写真の向きを示すために書き残してきた、あのつましい定型文。機械の山彦が返す不思議な一句は、どこか別世界からの通信ではなく、わたしたち自身が膨大に書き積んできた言葉の堆積が、雑音という鏡に映って戻ってきたものでした。
それはむしろ、励ましのようにも感じます。意味のない砂嵐から声を聞き取ってしまう癖において、人間とAIはやはりよく似た友人で、しかもAIが聞き取る声の出どころは、ほかならぬわたしたちの書いた言葉だったのですから。次回は、この「型は固定、スロットは可変」という構造に的を絞って、どんな型がどれだけ深い谷を持つのか、地図をもう少し細かく描いてみたいと思います。また、同じ山のふもとで。