エンジニアが教える転職者・就活生のための統計入門「平均」と「分布」

就活, 転職

さて、先の話の続きで、「売上高が急に上がった(下がった)」という事実の原因追求をしましょう。
今回は、「売上高がいつもは月間8000万円だったのが、今月(9月)は1億円だった」という事実に対し、上昇要因を調査することにします。
さらに、この会社の業種は「小売業(店舗のスーパー)」とケース設定しましょう。
いくつか、考えられる要因を挙げていく中で、「9月から取扱商品の種類を増やしたため、まとめ買いが増えたのでは?」という仮説があるとします。

この仮説を検証するには、まず「顧客の1注文あたりの平均注文商品数」を検証します。
そこで、過去3ヶ月間の平均注文商品数を集計したところ、以下の結果となっていました。

<過去3ヶ月間の平均注文商品数> 単位:商品
月 1注文当たりの平均注文商品数
6月 1.3
7月 1.3
8月 1.2
9月 1.6

上の表から、平均注文商品数は8月に下がっているものの、9月は6月以降、一番よい数字です。なので、当初の仮説「まとめ買いが増えた」ということは当てはまるかもしれません。

ただし、この注文商品数の「平均」だけでこの仮説が正しいと判断するのは早計です。
次に見るのは「分布」です。
今回のケースの場合、「分布」は「1注文あたりの購入商品数ごとの注文顧客数」と定義できます。これも集計したところ、下表の通りの結果となりました。

<1注文あたりの購入商品数の顧客分布> 単位:人数
月 1注文あたりの購入商品数
1個 2個 3個 4個 5個以上 合計
6月 6,500 700 500 200 100 8,000
7月 6,500 700 500 200 100 8,000
8月 7,100 300 300 200 100 8,000
9月 6,500 700 500 200 100 8,000

(注意)先の平均注文数の集計結果と、この購入商品数の顧客分布の集計結果について、あくまで例として出している数字なので、厳密に整合性は取っていません。

この集計結果を見て、注目すべきは6月、7月と9月の購入商品数の内訳人数が全く同じ、ということです。
平均注文数は9月の方が増えているのに、購入商品数の内訳がまったく変わらない、ということから言えるのは、上の表の9月の「5個以上」に該当する人のみ、なんらかの理由で9月、大幅に注文する商品数を増やしている、ということです。
また、ここに該当する人は、最大で100人、全注文者数(上表の1注文あたりの平均注文数の「合計」)が8000人とすると、注文者の中の比率はわずか1.2%しかありません。
「新シーズンの切り替えのため、まとめ買いが増えた」という仮説は、季節要因によるものなので、顧客を限定するものではなく、全体的に言える傾向といえますが、今回の集計結果のように、ごく一部の顧客の注文商品数が増えたということであれば、この仮説は当てはまらない可能性が高いです。

仮に、顧客の注文商品数の分布が以下の集計結果だとしたらどうでしょうか?

<1注文あたりの購入商品数の顧客分布> 単位:人数
月 1注文あたりの購入商品数
1個 2個 3個 4個 5個以上 合計
6月 6,500 700 500 200 100 8,000
7月 6,500 700 500 200 100 8,000
8月 7,100 300 300 200 100 8,000
9月 5,400 1,000 1,000 500 100 8,000

前回と同様に、6月・7月と9月の内訳を見ると、9月は1注文あたりの購入商品数が1個の人が減少し、2個~4個が大きく増えています。
この結果であれば、上の仮説「新シーズンの切り替えのため、まとめ買いが増えた」ということは考えられるかもしれません。

上の例はわかりやすくするため、少し極端な数字を出しましたが、このように、何らかの要因分析において、「平均を時系列の推移でみる」ということは最初に見るべき視点です。
ただし、平均が増加(または減少)しているという事実だけでは、それが全体的な傾向なのか、それとも一部の局地的な傾向なのかまではわかりません。全体的な傾向か、一部の局地的な傾向かによって、とるアクションは全然変わってくるため、検証する必要があります。それを知るのが「分布」です。

従って、「平均」値だけ知って全体を把握するのではなく、セットで「分布」も把握しておくことが大切です。

関連記事一覧