小品いろいろ
[2024/7/10]
【54】正規分布について
正規分はよく知られています。
数学的に厳密に扱うのでなければ、おおむね次のようなものです。
分布曲線が(おおむね)左右対称
(おおむね)中央がもっとも頻度が高い
(おおむね)左右に向かってだら下がりで、水平軸が漸近線
"おおむね"と断ったのは、数学的な確率密度関数を当てはめたとき、現実の自然現象はそれとの誤差が常につきまとうからです。
もっとも、厳密な議論は、私ができるものではありません。
Excelを使ってグラフを書いてみました。
さて、このような分布の例としてよく挙げられるのは、子どもたちの身長、体重、成績などです。
ここで取り上げようとするのは、私が"正規分布のコブ"と呼んでいるものです。
これは、水平軸の右方向にだら下がる時に、あるところで、コブのようにちょっと盛り上がるものです。
このアイディアは、ロス・インディオス・タバハラスのギターを聞いて思いつきました。
私がロス・インディオス・タバハラスについて極めて高い評価をしているのは、このサイトのいくつかの記事で書いているので分かると思います。
クラシック曲は沢山の演者が同じ曲を演奏しいるので、それをどれだけ優れているか、という観点で並べると、あまりひどい演奏は少なく、また並外れて優れた演奏も少なく、"ある程度"優れた演奏が一番多数であると、大まかですが、言えるでしょう。
クラシック曲をギターで演奏することはまったく少ないという訳ではありません。
しかし、そのような演奏を聴くと、ロス・インディオス・タバハラスは群を抜いているように感じられます。
確かに、ロス・インディオス・タバハラスは兄弟2人で演奏しているわけで、1人で演奏する場合とは訳が違います。しかし、できあがった演奏で比較するしかありません。一人あたりの演奏のレベルというわけにはいかないのです。
演奏のレベルを分布として考えると、中央が盛り上がり、左右がだらさがりになるというのが典型的でしょう。
もちろん、かなりおおざっぱに考えた場合です。
とても優れていると考えられるのは、とても数が少ないのですが、考えられないほで高いレベルのものが数は少なくても存在するのです。
なお、ここで"優れている"と言っているのは、私の評価で、つまり私の好みという観点です。
自然科学の世界では、いわゆる天才と称される人がいます。
わずかの業績を残しただけの人、かなり重要な業績を残した人など様々ですが、上に書いたこぶのような、かけ離れて大きな業績を残した人、というなら難しいように思えます。
アインシュタインはその候補に挙げられるでしょうが、それではニュートンはどうなのでしょうか。
自らの業績だけでなく、幾多の天才物理学者を育てたニールス・ボーアはどうでしょうか。コペルニクスははどうでしょうか。
ちょっと判断がつきません。
話は変り、日本での漢字を取り上げます。
常用漢字の改訂版が2010年に内閣告示されました。平成22年内閣告示第2号です。
以下では、書き方をベースに考えていきます。
ふよう堂編集部編 早わかり 常用漢字辞字典 ふよう堂 2012年1月 初版p>
これを見ると、いろいろとおもしろいことが分かります。
ここで、漢字の画数を取り上げます。
画数が1の漢字は、"一"、"乙"の二つだけ、というのは有名な事実です。
画数と漢字の数を見ていくと次の様になります。
1画 2
2画 12
3画 31
4画 69
5画 99
と順調に増えていきます。
画数の多い方はこうなっています。
20画 11
21画 6
22画 3
23画 1
24画 0
25画 0
26画 0
27画 0
28画 0
29画 1
11, 6, 3, 1と順調に少なくなり、0が五つ続いた後、29画のところで突然1が飛び込んできます。
これが最後で、30画以上はありません。
この29画の漢字は何か、という事が気になります。
"鬱"なのです。この憂鬱の鬱の字が2010年の改訂で常用漢字に追加されました。
"憂鬱"とか"鬱病"は、以前は鬱の文字は常用漢字に含まれていなかったためか、"憂うつ"、"うつ病"と表記することが多かったような印象を持っていますが、これからは漢字表記が増えるのでしょうね。
確かに、"憂鬱"という言葉はよく使われ、それを"憂うつ"と書くのは変な感じがします。、
余談ですが、この鬱の書き方の覚え方が、ネット上にいくつか見つかります。
なお、常用漢字は必ずしも書けることが求められるわけではない、とされてはいますが、書けた方が良いでしょう。
そこで、こういうものは、自分で考えるのが一番わかりやすいだろうからということで、考えてみました。
「木缶木ワ米をカップにヒ杉だよ」
この漢字の上の部分を「木缶木」とするのは普通にあるようです。筆順としては、中央に"缶"、その左に"木"、右に"木"と言う順序で書くことになりますが、「木缶木」と憶えれば十分でしょう。
"ワ"はワカンムリです。
「米をカップに」は、米印(※)をカップ、つまり漢字で言えば凵(部首名では受け箱、かんにょう、かんがまえ)に入れるというものです。
"彡"は杉という漢字が一番イメージしやすいので使いました。
とにかく、24画~28画の漢字がなく、その後の29画で一つ出てくるというのは異様な感じがします。ですが、一方では、「そういうこともあって当然だな」とも思います。
一般に、中央にピークがあり、それから離れるにつれて数が少なくなる、というのはとても自然なような気はします。
一方、中央から離れたところに、ちょっとしたピークある、というのもあっていいような気がするのです。ある意味で、それもまた自然であると思います。
「世の中、そう単純にはいかないよ」ということですね。
海岸の砂浜に1m四方の枠を書き、表面から深さ5cm程度の砂を手ですくい取ることを考えます。
数で言えば砂粒がほとんどですが、中に小石が含まれることがあるでしょう。砂粒と小石では生成された過程が違うわけで、たとえば砂粒が数百万個、数千万個、あるいはそれ以上あっても、小石は数個かもしれません。
砂粒と小石を大きさで分類すると、砂粒は正規分布に近いものになると思います。
1mm以下の大きさの砂粒がほとんどで、3mmとか5mmなどの砂粒はないでしょう。それでいて30mm、50mmなどの小石があるのです。
分布で言うと、砂粒が一個もない状態が続いた先に小石が数個出てくるのです。
分布曲線で離れたところは、異質なものであるような気がします。
その一つの例は日本の山の高さです。
3000~3200mの間にはいくつかあり、3000m未満の山は非常に多いです。3200mを超えると、その次は富士山の3772mまでありません。
3000~3200mの山は大部分が北アルプス、南アルブスの山脈上にあります。山脈の一つのピークです。北アルプス、南アルブス以外ではちょっと離れた乗鞍岳と御嶽山の二つです。
乗鞍岳は北アルプスの一部なのか独立峰なのかは意見が分かれるようですが、御嶽山は独立峰です。
富士山は孤立した存在です。北アルプス、南アルブスの山々とはでき方が違います。
乗鞍岳と御嶽山ですが、高さだけで見ると北アルプス、南アルブスの山々に紛れていますが、富士山だけは位置的にも高さ的にも孤立しているのです。
自然を歩く 登山・トレッキングとスノーシューというサイトで3000m以上の山を分類してみましょう。
3000~3100m 未満 13
3100~3200m 未満 9
3200~3300m 未満 0
3300~3400m 未満 0
3400~3500m 未満 0
3500~3600m 未満 0
3600~3700m 未満 0
3700~3800m 未満 1
山のというものは、どれだけ細かく見るかという点で数え方が違ってくることがありますが、いくつかのサイトで見ると同じような数になりました。
富士山の前にゼロが五つ並んでいるところが印象的です。
もっとも、場合によるので、たとえば川の長さではこのようにかけ離れた存在はないでしょう。
多くの場合、正規分布が当てはまるケースは多いと思いますが、上に書いた様な"こぶ付き"の正規分布的なパターンも少なくはないように思われます。
"こぶ付き"の正規分布的なパターンの例としては、たとえば都道府県の面積が上げられます。
言うまでもなく、北海道がかけ離れて大きいです。それは北海道の開発の歴史によるもので、富士山のように、成立した経緯が独特だからです。
戦争による被害というのは、第一次世界大戦で飛躍的に増大し、第二次世界大戦でさらに飛躍的に増大しました。
第三次世界大戦があるとすると、第一次世界大戦、第二次世界大戦の延長を大きく外れた極端に大きな被害があるかもしれません。それは人類が滅亡するような規模なのかもしれません。
そのようなことが起こりませんように、と、我が子、我が孫の為だけでなく、全ての人類のために祈るばかりです。
・・・・
「祈る?」、何に対して?
私は、確信を持って信じる信仰はありません。
ですが祈りたい、と思う気持ちはあります。
私はいま、満74才です。あと何年生きていられるか。生きているだけでなく、正常な思考を保つことができることがあと何年あるのか、心許ないです。
健康寿命という点で、私が"こぶ付き正規分布"の"こぶ"に当てはまる可能性はほとんどないでしょう。
では、私には何ができるのでしょうか。何を残すことができるのでしょうか。
何を残すべきなのでしょうか。