エンジニアが教える転職者・就活生のための統計入門「相関関係」と「因果関係」

就活, 転職

ある複数の事実についての関係性を示すのに、「相関」「因果」という概念が出てきます。
この2つは一見似た概念のように思えますが、実際は異なるものです。
それぞれについて、詳しくこれからお話しましょう。

「相関関係」

「相関」…2つの変量の間に、一方が増えた時にもう片方が減る、または増える傾向があること。

一方が増えた時にもう片方が増える関係のことを、「正の相関関係」、もう片方が減る関係のことを「負の相関関係」と言います。この傾向の度合いを示したものが相関係数といいます。

一つ例を出します。
先の例「まとめ買いをしている人が増えていたため、売上高が今月いつもより増加した」ということが証明できた、とします。
そして、次にまとめ買いのパターンを詳細に調査することになりました。
具体的には、商品ごとに、よく同時購入されるものがないか調べてみる、というものです。

そこで、販売商品を調べてみると、「ウイスキーの販売数とおむつの販売数は正の相関関係にある」ということが証明された、とします。
つまり、ウイスキーの販売数が増えれば、おむつの販売数も増える、ということがデータで実証されたということです。
この事実を踏まえ、これから、「ウイスキーの販売場所の近くに、おむつの販売場所を移動する」というレイアウト変更が実施されました。売上は増えたのでしょうか?

ここで「相関関係」について追加で説明が必要になります。
「相関関係」とは、2つの事象に関しての「関係性」を示すものであり、「原因」「理由」を示すものではない、ということです。
それを示すのが、「因果関係」です。

「因果関係」

因果関係とは、先に少しお話したとおり、「ある事象を発生させることになった原因」です。
因果関係とは、「原因→結果」という図式に表すことが重要です。
意外と、「結果→原因」といったような、順番を逆にしてしまうケースが多く、そうすると、因果関係を間違って把握することになります。
簡単なことなのですが、これを留意しておいてください。

例えば、先の例で「ウイスキーの販売数」と「おむつの販売数」が相関関係にあるということはわかりましたが、因果関係についてはどうでしょうか?
因果関係が「原因→結果」という関係性なので、単純にこれを置き換えると、「ウイスキーの販売数が伸びたため(原因)、おむつの販売数が伸びた(結果)」となります。
果たして、本当なのでしょうか?
ここまで読んでいて、大部分の人がこの因果関係について疑いを持っているのではないかと思います。

そこで、この「ウイスキーの販売数」と「おむつの販売数」の相関関係を踏まえ、「なぜこの2つの商品の販売数に相関関係があるのか?」という疑問を検証することにします。
ここで、いくつかの事実と、この店舗の背景を以下追記します。
・ウイスキーを購入しているのは、主に30代以上の男性会社員
・おむつは、近隣にドラッグストアがありこの店舗では主力商品ではない
・この店舗の立地は、郊外の新興住宅街。30代の核家族の世帯が最も多い。

上記の事実を踏まえて、例えば、以下の仮説が考えられます。

1.まだ子供が小さく、外への買い物も制限される世帯について、ストックしている日常品が急に家庭内で品切れとなってしまうことがある(例:おむつ、トイレットペーパー、シャンプー、リンスなど)。
2.1のケースの場合、会社帰りの配偶者(夫)に当日連絡し、帰宅時にスーパーでおむつなどを買ってもらうように依頼。
3.連絡を受けた旦那さんは、おむつを買うが、ついでに自分用の嗜好品(この場合はウイスキーなどのアルコール飲料)もあわせて購入する。

ここから考えられる因果関係は、図にすると以下のようになります。

子供が小さい世帯では、急におむつなどの日用品が切れるケースがあり、その時、配偶者に当日買い物を依頼する。(おむつの購入品数が増える原因)

依頼された配偶者は、帰宅時間が夜になるためその時間でも開いているスーパーで、おむつなどの日用品を購入する(ウイスキーの購入品数が増える原因)

その時、依頼された配偶者はついでにウイスキーなどの自分用の嗜好品も合わせてついで買いする。(結果)

この因果関係図は、統計学やデータとしては検証できるものではありませんが、
この因果関係が正しいかどうかは、この仮説に基づいたアクションによって売上が増えるかどうかでしょう。

この因果関係が正しければ、「ウイスキーのとなりにおむつ売り場を移動」しても、売上アップにはつながらないでしょう。なぜなら、「おむつを買う」という目的が先にあるので、とるアクションとしては、「おむつ売り場の近くに、(ウイスキーのような)男性向けの嗜好品を並べておく」というのが、ついで買い(まとめ買い)を促進させるのに効果がありそうです。

今回はデータではなく、思考方法に関する話が中心となりましたが、ビジネスの現場においては、因果関係については統計分析よりも、さまざまな事実を踏まえた上での「仮説立証」が何より重要です。

※相関関係は統計学ですが、因果関係については、統計学というよりも論理学(哲学系)の範疇に入ることの方が多いようです。

関連記事一覧