踊る人形の暗号解読はキャラ名に左右される?(後編)

前回まで

作者が設定した三つの人名地名の中にそれぞれ"E"が2つづつ使われている。これはホームズに暗号を解かせるための"E"の水増しではないだろうか!?

 

 

と言うわけで非常にてきとーに検証してみた。

果たして"E"は英国人の名前でも最頻出の文字なのだろうか。

 

子供の名前と言うと日本では保険会社が調査発表しているものがお馴染みだが、検索してみるとイギリスでは政府が毎年発表しているようだ。

Baby names in England and Wales Statistical bulletins

https://www.ons.gov.uk/peoplepopulationandcommunity/birthsdeathsandmarriages/livebirths/bulletins/babynamesenglandandwales/previousReleases

 

過去のデータもすべてアーカイブされているそうで、本来すべてを集計すべきところだが、あくまでてきとーに最新版(2018年)の1年分の男女データのみをダウンロードし、pythonスクリプトで文字の頻度を集計してみた。

 

f:id:pabupabu:20200210204525p:image

 

男の子は"A-E"がツートップ。女の子は"A-E-L-I"の順であった。

 

一方ホームズによると

原作: "Speaking roughly, T, A, O, I, N, S, H, R, D, and L are the numerical order in which letters occur; but T, A, O, and I are very nearly abreast of each other"

拙訳: 「大雑把に言ってT-A-O-I-N-S-H-R-D-Lの順に多く、T-A-O-Iまではほぼ同列。」

 

やはり通常の文章における出現頻度とは若干違いがある。

 

さて今回注目している作中の登場人物名は、男性が"ABE"、女性は"ELSIE"。

男性名の方は頻度ツートップのAとEが使用されているので穏当な設定であろう。そもそも原作でホームズは "Abe is an American contraction"と解説しており、イギリス人の名前とは異質なものととらえている。

女性名ELSIEの方はどうか。

 頻度トップの"A"こそ使用されていないが続くE-L-Iをカバーする見事な選択(^_^;)

 

あくまでてきとーな検証だが、結論としては

「"ELSIE"の方は頻度最大のAを無視しちゃってEを二個も詰め込んでますけどまあおかしくは無いですよね。さすがコナン先生。」

と言うところだ。