日記

相関と因果の違いを意識する

公開日
2013/12/27
更新日
2013/12/27

独り言

学校で行ったアンケートなどのデータを見せていただく機会がよくあります。この時気をつけているのが、相関と因果の違いです。

例えば先日の新聞にあった「だらだらネット成績ダウン」という記事は、全国学力学習状況調査をもとに、ネットを長時間使う生徒は正答率が低かったという事実を報道しているのですが、ネットの利用時間と正答率に(負の)相関関係があるというだけであって、ネットを利用したから正答率が低いという因果関係があるかどうかまでは根拠しているデータからは言えるわけではありません。そもそも勉強が嫌いだからネットをたくさん利用したのかもしれません。ネットを利用しなければテレビを見ていたのかもしれません。学習時間と正答率、学習時間とネット利用の関係を調べて、学習時間が多ければ正答率が高く、同じ学習時間でもネットをよく利用する子どもの正答率が低いというような結果がでれば、どうもネットの利用は正答率に悪い影響を与えるようだということになります。同じ学習時間であれば、ネットの利用にかかわらず正答率が変わらないのであれば、ネットではなく学習時間が少ないことが原因と言えそうです。
相関関係を深く考えずに因果関係に置き換えてしまい、その結果もっともらしい結論が見えてくると、ついそれに飛びついてしまいます。このようなことがないように、因果関係が言えるためには他にどのような条件やデータが必要かを考える習慣を持つことが大切です。

先ほどのネット利用と正答率の関係は、ネットのない時代のテレビの視聴時間と学習成績の関係と同じような傾向があるのではないかと思います。子どもたちは、学習よりも目先の面白いものに時間を使う傾向があり、そのような子どもは学習成績がよくないということでしょう。このことを裏付けるデータを持っていませんが、もしそうであれば、ネット利用を制限することが正答率を上げることにつながるかどうかは、ネットの利用時間が減ると学習時間が増えるかどうかに依存するわけです。ネットの利用を制限しても、学習以外のことに時間を使うならばあまり意味はないということです。正答率に寄与する要因が何かを見極める必要があるのです。

もしネットと学習成績に因果関係があるかどうかを知りたければ、そのことがわかるためのデータを集める必要があります。学校のアンケートも相関関係を知りたいのか、因果関係も意識するのかでその質問項目やデータ処理の仕方が変わってきます。相関と因果関係を混同せず、その違いを意識して情報を集め、分析するようにしたいものです。