度数分布の説明

度数分布とは何かが発生する頻度(度数)をまとめたものである。 一般的に 度数分布表 という表を作成する。

何かというのは専門用語では 階級 と言う。 グループとか項目と同じ意味。

階級が数字の場合は 階級幅 を設定してデータの区間を設定することができる。 階級の区間において階級を代表する値は 階級値 と呼ぶ。

ナンバーズでは抽せん数字を0から999の数字ととらえることで 階級を「0〜99」「100〜199」のように階級を100ごとに区切って出現回数を調査できる。 このときの階級幅は100となり、階級の真ん中の値が階級値となる。

階級値 = (階級の初め値 + 階級の終わりの値) / 2

度数分布表というのは統計学においてデータを整理するための 基本中の基本 でとても大切。

度数分布表の例

「抽せん数字」を階級にした度数分布表

ナンバーズ3の第1回から第4163回の抽せん数字を用いて、度数(当せん回数)が多い抽せん数字を10個。

抽せん数字(階級) 度数(当せん回数)
638 11
618 11
908 10
845 10
198 10
928 10
199 10
703 10
943 10
232 9

「抽せん数字」を階級幅100で設定した度数分布表

第1回から第4163回の抽せん数字で集計。

階級(抽せん数字の区間) 階級値 度数(当せん回数)
0 - 99 49.5 389
100 - 199 149.5 420
200 - 299 249.5 422
300 - 399 349.5 409
400 - 499 449.5 410
500 - 599 549.5 388
600 - 699 649.5 428
700 - 799 749.5 402
800 - 899 849.5 446
900 - 999 949.5 449
度数分布表の棒グラフ

相対度数、累積度数、累積相対度数

  • 相対度数は1つの階級の度数が、すべてデータの度数の合計のうちどれくらいの割合を示すもの
  • 累積度数は階級ごとの度数を足しあわせた値
  • 累積相対度数は階級ごとの相対度数を足し合わせた値

上で示した『「抽せん数字」を階級幅100で設定した度数分布表』に相対度数、累積度数、累積相対度数を追加してみます。

「抽せん数字」を階級幅100で設定した度数分布表 (第1回から第4163回)
階級(抽せん数字の区間) 度数(当せん回数) 相対度数 累積度数 累積相対度数
0 - 99 389 0.093442 389 0.093442
100 - 199 420 0.100889 809 0.194331
200 - 299 422 0.101369 1231 0.295700
300 - 399 409 0.098246 1640 0.393947
400 - 499 410 0.098487 2050 0.492433
500 - 599 388 0.093202 2438 0.585635
600 - 699 428 0.102810 2866 0.688446
700 - 799 402 0.096565 3268 0.785011
800 - 899 446 0.107134 3714 0.892145
900 - 999 449 0.107855 4163 1.000000

累積度数は上から順に度数を合計したものとなっている。そのため、最後の階級(ここでは「900 - 999」)の累積度数は度数の合計となり、累積相対度数は 1.0 となる。

それぞれの計算式:

相対度数 = 階級の度数 ÷ 度数の合計

累積度数 = 階級(n番目)の度数 + 階級(n-1番目)の度数

累積相対度数 = 階級(n番目)の相対度数 + 階級(n-1番目)の相対度数

ナンバーズの予想に使うには

ナンバーズの予想に度数分布表をどのように使うのか?

それは抽せん数字の出現傾向を把握するためだ。

単純に抽せん数字ごとに出現回数を集計した場合、 上の表を参考にすれば「過去に638が当選しやすい数字だから、次回も638を買おう」と予想できる。

ただこれではデータの傾向が大雑把なので、 抽せん数字に与えるであろう要因を絞り込んだ度数分布表 が求められるはず。

例えば

  • 曜日ごとの抽せん数字の出現傾向
  • 月ごとの抽せん数字の出現傾向
  • 位ごとの抽せん数字の出現傾向

といった具合に度数分布表を作るという作業は、どのような視点でデータを把握したいのかを考える必要がある。

度数分布表の内容によって予想番号にも違いが出てくる。


最終更新日: 2016年02月13日(土)


Back to top