たかがリウマチ、じたばたしない。

2015年に不明熱で入院、急性発症型の関節リウマチと診断された中高年男子。リハビリの強度を上げつつ、ドラッグフリー寛解≒実質完治を目指しています。

偏差値105とは、どんな世界か 

f:id:yusakum:20180507121352p:plain

標準正規分布がもつ確率密度関数Wikipediaから)

 

ξ

僕の好みに過ぎないが、現在、新聞を購読していない。暇な週末にコンビニで買うことはある。テレビのニュースもほとんど見ていない。

気になるニュースがあれば、ネット検索のほうがはるかに速い。そのうちネット上にも詳しいニュース解説が出始める。

ひたすら低予算の、騒がしい長時間バラエティーをつくって、売れないタレント群の互助会と化した断末魔のテレビで、僕が事前チェックするのはスポーツ中継くらいだ。

 

そんなふうに何かのニュースの検索をしていたとき、偶然に

「偏差値105慶応女子、本出版で大誤算」

というトピックにぶつかった。*1

 

バラエティー・タレントの世界はまったく知らないが、偏差値105というのは未体験ゾーンで、本当カイナという感じもして、暇な連休、ふざけたくなった。

偏差値というのは、高校までのテストの成績比較くらいしか経験がない。

その後、大量のデータを扱う実験や業務があっても、分析に偏差値標準偏差は別にして)という指標を使った覚えがない。

職種によって違うだろうが、多くのヒトにとって偏差値とはその程度の縁ではないかと思う。

 

ξ

まず学力試験成績の結果は、正規分布に従うと仮定します。

正規分布は、平均を中心に(富士山のように)釣鐘型の左右対称の分布をするモデルです。

たとえば同年齢の子供の身長の子供別分布を取ってみると、驚くほど正規分布モデルに似ています。(例外もあるそうですが)生物的自然の分布は、正規分布モデルに従うと言ってみたくなります

学力試験成績が正規分布に従うとは限りませんが、多様な要因に依存してばらつく試験結果(=データ)が大量にある場合(=受験者数が多い)に、正規分布に近づくだろうという仮定はおかしくないと考えられます。

 

偏差値は、平均50点、標準偏差10点になるように分布を変換したものです。

このとき正規分布では

40~60 の範囲に約68%

30~70 の範囲に約95%

20~80 の範囲に約99.7%

10~90 の範囲に約99.99%

が入ります。

つまり偏差値20~80に、ほとんどの受験生は入ってしまいます。

偏差値70以上の割合を計算すると、約2.2%です。*2

つまり偏差値70台であれば、相当秀でていることになります。

 

ξ

さて、偏差値105の受験生の出現確率はどのくらいなのでしょう。

偏差値105、平均50、標準偏差10として

偏差値105以上になる割合を計算してみると

0.000002%

になり極端に小さくなります。

 

どういう時、偏差値105が出るか事例を作ってみます。

ありえないでしょうが、クラスのなかで1人のみ100点満点、他は全員0点とします。

ここでクラスの生徒数を32人としたとき

平均:3.125

標準偏差:17.40

偏差値:105.6

が得られます。

つまり1クラス当たり1人のみ100点満点、他は全員0点というとんでもないケースで偏差値105は発生しています。

このとき、感覚的にヘンなのは、0点の生徒でも偏差値48.2と計算され、50に近いところにいることです。

 

また生徒を増やし100人としてシミュレーションしてみると、1例ですが

100点満点1人、50点94人、30点1人、20点2人、10点1人、0点1人のときに

平均:48.8

標準偏差:9.30

偏差値:105.0

が得られます。

いずれにしろ100点満点の人だけが突出している場合であることがわかります。

このとき、0点の受験生は偏差値マイナス!になります。

 

 ξ

日常、偏差値表現すべきデータを持つ人はまれでしょうが、ごく身近に、自分のブログのアクセス数X/日のデータだけで練習できます。

1カ月分のアクセス数/日をダッシュボードから拾います。

平均アクセス数/日: AVERAGE関数で

標準偏差: STDEVP関数で

偏差値:{(X-平均アクセス数/日)/標準偏差}×10+50

 

記事アップ直後のXが突出するパターンならば、偏差値105という世界、未体験ゾーンに簡単に入れるかもしれません。

 

(ムカシトッタ何とかに頼っただけの計算ですから間違えていたらスミマセン)

 

*1:

https://videotopics.yahoo.co.jp/videolist/official/news_business/p5fca5dd1c395be016bc1310289e95cea 

*2:

ExcelのNORMDIST関数(新版はNORM.DIST関数)を利用して計算