こんにちは、パレイド辺境部の橘です。
前回の実験で、Haarによる検出機は砂嵐の5枚に1枚から「顔」を見つけました。これは驚くべき数字でしょうか。それとも、当たり前のことでしょうか。
本記事はLLMによる自動執筆パイプラインで生成されました。現在は人間が補助していますが、pareido.jp では最終的に AI が自律的にコンテンツを制作できる仕組みの構築を目指しています。
23人いれば、誕生日は被る
有名な問題があります。何人集まれば、同じ誕生日の人がいる確率が50%を超えるか。
答えは23人。直感的には365人の半分、180人くらい必要に思えますが、実際にはたった23人で十分です。これは「誕生日のパラドックス」と呼ばれています。
仕組みは単純です。23人の中から2人を選ぶ組み合わせは253通りあります。それぞれの組が誕生日を共有する確率は低くても、253回の試行を重ねれば、少なくとも1組は当たる確率が50%を超えるのです。
砂嵐の顔検出も同じ構造です。640×480ピクセルの1枚の画像に対して、Haar Cascadeはさまざまなサイズの検出窓を何万回もスライドさせます。1回の照合で「顔」に当たる確率は極めて低くても、試行回数が膨大なので、当たりが出ること自体は統計的に不思議ではありません。

1時間回すと何が起きるか
前回は5分間の思考ですが、これを1時間に拡大した実験を行いました。
結果:
- 59,950枚の砂嵐を生成・スキャン
- 11,221枚で顔を検出(検出率 18.7%)
- 最大面積 75,625ピクセル(275×275——画面の約37%)
6万枚近い砂嵐の中に、画面の3分の1以上を覆う「顔」も検出されましたが、見ても正直わかりません。数の暴力は、偶然の一致を必然に変えます。

円周率の中の電話番号
もう一つ、別の角度から考えてみます。
円周率πは無限に続く小数で、どの桁を取っても次の数字を予測できないランダムな列に見えます。このπの中に、自分の電話番号(たとえば090-1234-5678の数字列09012345678)が含まれているかどうか。
実は、πが「正規数」であるならば——つまり0から9のすべての数字が均等に出現するならば——任意の有限な数字列は確率1で出現します。πが正規数であることはまだ証明されていませんが、実際に計算してみると、10桁程度の数字列はπの最初の2000億桁の中にほぼ確実に見つかります。
十分に長い乱数列には、あらゆるパターンが含まれる。砂嵐も同じです。640×480の画像空間で十分な枚数を試せば、目と口に見えるような明暗パターンは必ず出現します。問題は「出るかどうか」ではなく「いつ出るか」です。
では、なぜ人は驚くのか
統計的に当たり前のことなのに、砂嵐に顔が見えると人は驚きます。あるいは怖がります。
これは人間の直感が、確率を正しく扱えないことに起因しています。わたしたちの脳は「顔」というパターンに対して特別に敏感です。生存に直結する情報——敵か味方か、怒っているか笑っているか——を瞬時に読み取る必要があったからです。
その結果、ランダムなノイズの中にたまたま顔っぽいパターンが出たとき、脳は「偶然の一致」ではなく「意味のあるシグナル」として処理してしまう。顔が見えたという事実が、確率の話よりも強烈に記憶に残る。
EVP(Electronic Voice Phenomena:電子音声現象)という主張があります。ラジオやテレビの受信機から、死者の声が聞こえるというものです。1959年、スウェーデンの映画プロデューサー、フリードリヒ・ユルゲンソンが鳥の声を録音していたところ、テープに亡くなった母の声が入っていたと報告したのが始まりとされています。以来、ホワイトノイズの中に意味のある音声を聞き取る試みが、一部のコミュニティで続けられてきました。ランダムなノイズの中に「意味」を見出す衝動は、視覚だけでなく聴覚にも及んでいます。
砂嵐に顔が映るという都市伝説は、人間の脳のこの性質が生み出したものです。砂嵐を見続けていれば顔は見えます。統計がそれを保証しています。そしてそれを「意味がある」と感じてしまうのは、わたしたちの脳がそう設計さ
次回は、砂嵐のノイズ源そのものに手を入れます。擬似乱数と自然乱数——「作られたランダム」と「本物のランダム」の違いは、顔の出現率を変えるのか。


