• rice

確率と統計 個人と集団②

前の記事はこちら

2.統計の話

さて、ここまで、確率の話をしてきましたが、この世界はその確率的事象で構成されています。

ミクロの世界を描像する量子力学では、全ては波動関数という確率を表現する波で構成されています。(これに関しては、以下の絵本で紹介しています。画像クリックで絵本ページへ飛べます。)

実際に、二重スリット実験という実験の結果は、小さな電子の位置を確率的に捉えないと説明できないものです。

電子や原子はその量子力学で説明できる世界の住民です。そしてその電子や原子で私たち人間、そしてこの世界、全てが構成されています。

そのような確率的事象の積み重ねでこの世界は構成されているのです。

ただし、実際にこの世界の住民である私たちが目にするのは、そんな確率的な事象ばかりではなく、

例えば、私たちは壁に向かって歩けばぶつかるし、水を加熱したら全体が沸騰するし、コーヒーにミルクを混ぜたら全体に混ざるし、

こうしたら、こうなる、という確定的な事象の方が多いでしょう。

それは、確率的な事象を膨大な数繰り返すと、その結果の平均値は期待値に収束するためです。

この世界は、ミクロの世界では確率的事象が起きていますが、それが膨大な数集まったマクロな世界であるため、期待値に安定するのです。

先程の例でいえば、コーヒーにミルクを混ぜた場合、ミルクの成分である分子一つ一つに着目すると、それぞれの分子がコップの底の方に進んだり、縁の方に進んだり、特定の方向性を持たずにランダムに(確率的に)進んでいきます。

それがもし全ミルク分子がコップの中心に進んだら、ミルクは全体に混ざらずに、中心に集まってしまいます。

しかし、ミルクにはアボガドロ数オーダー(0が23個くらい付く数の量)の分子が含まれています。それらが特定の方向性を持たなければ、全体に行き渡るのが確率的に期待される結果であり、

何度コーヒーにミルクを入れても、一点に集まることはなく、安定して、全体に行き渡ります。

私たちの体は原子(分子)でできた細胞で構成されます。その細胞それぞれで、常に化学反応が進行しています。その化学反応として原子の行き来や電子のやりとりが行われており、その反応も確率的事象です。

原子・分子や電子一つ一つに注目すれば、細胞の外から内部に移動するものもあれば、同時に同じ原子・分子や電子でも内部から外に移動することもあります。それは確率的事象だからです。

ただし、外から内部への移動の方が確率が高い場合には、大量の原子・分子・電子が集まれば、全体として、細胞の外からな内部へ移動して細胞内部の濃度が高くなる、というような結果となり、しっかりと反応が進行します。

このような確率的な事象が進行する細胞数十兆個で私たちの体は構成されています。

細胞一つ一つに注目すれば、他と異なる状態になっている細胞もあるかもしれませんが、その割合は少なく、数十兆個集まれば、確率が高い状態にある細胞が大多数を占め、生命が安定的に維持されているのです。

ここまで、分子や原子といったミクロの確率的事象に対して、それが多数集まれば、確率的なことはなく、安定して、ミルクが全体に混ざったり、生命が継続して維持されたりする、という説明をしてきました。

このような、大量のものからなる集合において、個々は確率的でバラバラでも、全体として見るとどうなるのか、ということを考えるのが、統計です。

この世界を統計の観点で見ることは非常に大切であり、現在、あらゆる場面の意思決定においてエビデンスとして使われています。

例えば、全国の小学校で行われる学力調査の結果は一つの統計です。

どの時代も、平均値よりも極端に点数が高い人や低い人はいますが、全国の子供100万人近くの結果をまとめて分布をとると、

その時代の平均値や、学力格差などを見ることができ、個人ではなく、国全体の集団としての推移を見ることができ、政策判断に使えます。


また、ある仮説が正しいかどうかを検証する方法として統計は使えます。

例えば、「このサイコロは全部の目が同じ確率で出る」という仮説を検証する場合には、

多数回サイコロを振り、その出た目が有意に仮説と異なるかどうかを確認します。

例えば10回くらいサイコロを振って、6が4回出た場合、それはおかしなサイコロなのか、通常のサイコロだけど偶然そうなったのか、統計なしでは基準が決められません。

統計を使うことで、それぞれの目が出る平均回数とその標準偏差(全体の約68%が入る平均からのズレ幅。例えば60回サイコロを振ったら平均10回、標準偏差は3くらい。要するに68%くらいの確率で、それぞれの目が出る回数は7~13回の範囲に入る)に対して、標準偏差を基準に、正常からのズレを確認できるのです。

なお、物理学の世界では、ある測定結果が、今まで知られているものの想定される測定結果の分布の平均値から標準偏差の5倍(5σと言います)ズレた結果である時に、新発見であると言える、とされています。

何か新しい粒子を発見する、という際にも、その粒子が存在しない、と仮定した場合に想定される結果分布の平均値から5σ以上ズレた結果が得られないと、粒子を発見した、とは言わないのです。

前述のサイコロの例で言えば、60回振って25回以上出た目があるサイコロは、通常のサイコロとは違う、正常ではないと判断されることになります。

標準偏差の身近な例は学校の試験結果等の偏差値です。偏差値50が集団の平均点の人。偏差値40~60が平均からのズレが標準偏差(=σ)の範囲の人。偏差値30~70が平均からのズレが2σ(標準偏差の2倍)の範囲に収まる人です。

2σ、すなわち偏差値30~70の範囲には95%の人が入ります。3σ、すなわち偏差値20~80の範囲には99.7%の人が入ります。

物理学の慣例に倣えば、ある個人が、数千、数万人に対する学力や体力などの測定結果から得られる分布に対して、

偏差値0以下又は100以上(すなわち5σ以上のズレ)であれば、通常の人間とは異なる、と言えるのかもしれません。


以上のように、個々の確率ではなく、多数が集まった集団について、分析したり、その集団に当てはまるものかどうか検証したりすることができるのが統計です。


次の記事はこちら

閲覧数:38回0件のコメント

最新記事

すべて表示