データ分析は大事と言う前に…
先日、ある企業再生ファンドの方に投資先として注目している企業特性を伺ったところ、こんな回答が返ってきました。
「顧客基盤データを膨大に持っているのに、活用が上手くいっていない会社かな」
答えた背景は、企業が顧客基盤を蓄積するには膨大な時間と信頼が必要だが、そのデータを活かす人材、戦略、パートナーを全く見つけられずに衰退する企業が多すぎるから…とのことでした。この話を聞いた時に、私はこのような企業は珍しくないのだなと痛感しました。というのも、過去にこんなことがあったからです。
*ある企業での出来事
ある企業でデータ検証結果を見てほしいと言われて、自ら出向いたことありました。検証結果を見て衝撃が走り、思わず口にしてしまった言葉があります。
「すみません。ここで検証したい仮説はなんでしょうか?○○さんの企業では、この検証は予測でなく、この商品が売れなくなった原因、つまり因果関係を検証したいんですよね…」
その後、計量経済学が重宝されている理由を伝えつつ、自戒も込めてデータ検証に仮説構築がなぜ重要かを一緒に考える時間を頂きました。
*因果関係を検証する際に仮説構築が重要な理由
仮説構築が重要な理由は、そのデータ分析が「見せかけの関係」や「逆因果関係」の懸念を払しょくするためにあります。そもそも、現実社会のデータには、検証を行いたいと思っている本質的な因果関係には無関係なはずのノイズが多いことがほとんどです。データが多いことのメリットは沢山ありますが、逆に多すぎることのデメリットもあるわけです。
「見せかけの関係」とは、データだけを見て、表面的な関係性を誤って捉えてしまうことです。例えば、「ある薬を摂取するほど、体重減少には負の相関がある」なんて言われたら尤もらしいかもしれません。しかし、その薬を飲んでいる被験者達の独自の特性が影響しているかもしれません。その他には、被験者達の生活環境が平均的に著しく改善(または悪化)するイベントの発生など別の要因が影響しているかもしれません。だからこそ、そのようなノイズ(検証したい因果関係に本質的に影響しないもの)を事前に除くために仮説を構築することが必要なのです。(ちなみに、対処法としては上記のような効果測定などの因果関係検証には、今年のノーベル経済学賞でも有名になったRCT法が有名です。)
「逆因果関係」とは、これは聞いたことがある人は少なくないと思います。「降水確率が上がると、コンビニ傘の売上高は増える」という関係はすぐにピンとくると思います。しかし、逆に「コンビニ傘の売上高が増えると、降水確率が上がる」なんて因果関係は、何の説得力もないのは明らかでしょう。でも、そういう逆因果は、ついついしてしまいがちなのです…。もちろん、手元にあるデータを総当たりして、何か目立つ相関関係を見つけて、仮説を構築することもあります。でも、相関関係を見つけても、そこから説得力のある背景や理由を見つけてくるのが重要ではありますが…。もちろん因果関係を見つけ出すことは非常に難しいことですが、自社や身の回りのデータ検証で、仮説が全くない中で検証が行われていたら、上記の懸念を危惧することをお勧めします。
*株式市場ニュースや、経済ニュースを読む際にも意識したい
そして、この因果関係について難しいのはビジネスの場だけではなく、資本市場の世界でもです。外国人投資家が株を買うから、株価が上がる。日本経済が良いから株価が上がる。為替が円安だから、株価があがる。これは、往々にして逆因果のこともあるでしょう、見せかけの関係のことも多々あります。
今回は、データ検証の一丁目一番地の話を、自戒を込めて記しました。私も過去に、仮説は?なんて担当教官に詰められたことが何度もあります(笑)
今日も読んでくださりありがとうございます!
応援いつもありがとうございます!
崔真淑(さいますみ)