見出し画像

「データを見て仮説を持つ」という迷信に振り回されるのは、もう止めよう

うちはデブオプスみたいなところはすごく意識していまして、エンジニアとユーザーやお客様の間に、いかに人がいないかが大事だと考えています。エンジニアがユーザーや顧客の課題にどれだけダイレクトに、データを見て仮説を持って、開発の前段階のレベルでどれだけ関われるか。

本当のような嘘の話の代表例3つを挙げるなら「梅田・ヘップファイブの観覧車にカップルで乗ると別れてしまう」「スカイツリーが東京五芒星の一角を成している」、そして「データを見て仮説を得る」です。

3つ目の『本当のような嘘の話』はタチが悪くて、1000人に1人はデータを見るだけで本当に仮説を浮かべてしまうのです。それは単に変態なだけで、普通はそんなことできません。

なぜ「できない」と私は断言できるのか? その根拠を、順を追って説明していきます。


仮説とは何か? どうやって仮説を作るのか?

仮説とは、ある「問い」に対する、正しさが証明できていない「仮の答え」です。関西人風に言えば「○○じゃない? 知らんけど」ってやつです。

ビジネスにおいて、シャープで、クレバーで、とても自分の発想に無かった「仮説」を生める人こそセクシーだと私は思います。発想力とか、空想力が求められるんでしょうか。私は妄想力しかないです。

「仮説」を語る上で、見落とされがちなのが「問い」です。「問い」こそが「仮説」を決めます。例えば、以下3つの「問い」を見比べて下さい。同じテーマでありながらも、求める「仮説」の内容は全く異なります。

①誰が坂本龍馬を殺したのか?
②どのように坂本龍馬を殺したのか?
③なぜ坂本龍馬を殺したのか?

何を知りたいかに応じて「仮説」が生まれるので、まずは「問い」の解像度をトコトンまで高めることが重要である…というのは、もう少し知られても良いかもしれません。

話を戻します。「問い」が定まった後、シャープで、クレバーで、とても自分の発想に無かった「仮説」を生むにはどうすれば良いでしょうか。

私は「仮説」という言葉自体を「仮説構築」と「仮説検証」に分けるべきだと考えます。そして、前者では「思考の発散」を求め、後者では「筋の良い可能性に収斂」を求めるべきです。

例えば、先ほどの「誰が坂本龍馬を殺したのか?」という問いに対して、薩摩説、長州説、土佐説、紀州説、新撰組説、見廻組説…様々な可能性が列挙できます。考えうる可能性を広げるのが仮説構築です。

様々な選択肢のうち、可能性が高そうなもの、論理立てると筋が良さそうなものに収斂するのが仮説検証です。もちろん、その際には多少なりとも「事実による裏付け」も必要になるでしょう。

すなわち、仮説構築と仮説検証に求められる論理力、ゴールに至るためのつみきの積み上げ方は全く異なると言っても過言ではありません。

スクリーンショット 2021-08-15 17.29.05

では、どうやって仮説を構築すれば良いのか。論理的推論の1つである「アブダクション」を用います。個別の事象から、最も適切に説明できる仮説を導き出すのが「アブダクションです。

アブダクションは、Bという結論に規則「AならばBである」を当てはめて、仮定Aを推論する手法です。例えば「地面が一面濡れている。雨が降ると地面が一面濡れる。したがって、雨が降ったに違いない」と考えるのがアブダクションです。仮定Aこそが、今目の前にある事実から導かれる仮説です。

つまり、規則「AならばBである」の引き出しをどれだけ持っているか大会でもあり、結論Bをどこまで事実のまま観測できるか大会でもあります。

例えば「地面が一部だけ濡れている」としましょう。雨が降ると地面が濡れるが、一部だけとは考えられない。ホースで水を撒くと一部だけ濡れるが、この辺りで水を撒ける蛇口はない…思い浮かぶ規則を探し出します。

よーく見ると、少し離れた場所に、中身が少し入ったペットボトルがあるなら「誰かがペットボトルから水を溢したら、地面が一部だけ濡れる」という可能性も浮かびます。

アブダクションと言えば推理小説です。アーサー・コナン・ドイル「緋色の研究」で、シャーロック・ホームズはワトソンと出会って直ぐに「アフガニスタン帰りですね」と言い当てます。その理由として、ホームズは次のように述べます。

「ここに医師風の男がいる、だが軍人の雰囲気もある。では軍医なのは明らか。彼は熱帯地方から帰ってきたばかりだ、というのも顔が黒いが、地肌でない上、なにしろ腕が白い。彼は艱難病苦を経験している、やつれた顔がなによりの証拠だ。左腕を負傷していて、ぎこちなく不自然な動きをしている。熱帯地方のどこに、英国軍医が苦難を経験し、腕に負傷を受けてしまうような所がある? アフガニスタンをおいて他になし。」

当時、アフガン戦争の真っ只中にあったという事実があってこそ導けたという前提を忘れてはいけませんが、それにしても良い仮説構築だと思いませんか?


データとは何か?

データを数字だと考えている人が多いのですが、実際には違います。順を追って説明します。データの定義について国際標準化機構より引用します。

情報の表現であって、伝達、解釈または処理に適するように形式化され、再度情報として解釈できるもの。

つまり、伝達・解釈・処理に適するのであれば、データとはダンスでも絵画でも言葉でも良いわけです。表現できるものは、あらゆるものが「データ」です。万国共通で、誰もが認識の齟齬ない表現として最適なものが「数字」に過ぎないのです。

では、情報の表現とありますが、情報とはそもそも何でしょうか。

事実、事象、過程、着想などの対象物に関して知り得たことであって、概念を含み、一定の文脈中で特定の意味をもつもの。

何らかの意味を持つものが情報なのです。例えば「530000」だけなら単なる数で、情報ではありません。「私の戦闘力は530000です」と言われて、初めて特定の意味が生まれて「530000」は情報となります。

さて、ここで重要なのは「表現」という言葉です。情報を"表現"し再度解釈できると言いますが、表現するにあたって、どこまで情報は欠落するでしょうか。すなわち、どこまで量を保ちデータとして表現できるでしょうか。

画像2

渋谷の雑踏をデータにすると言っても、写真以外で情報量を保ったまま形式化され、かつ解釈でいる方法を知りません。一方で、写真は伝達にも解釈にも時間を要します。

コロナ禍において「人流」という単語が言われるようになりましたが、減った増えたとは聞いても、ある時点において、どれくらいの人がいるのかは現地に赴くか、その瞬間を抑えた写真に勝るデータはありません。すなわち数字というデータ化によって、実際にその現場に赴くよりも、情報が欠落しているのです。

その分、大量に処理できるというメリットはあるんですけどね。


「データ」から仮説は生まれるか?

アブダクションを用いて仮説を構築するなら、結論(事象)、規則が必要になります。「データ」から仮説を構築するとは、すなわち事象=データということになります。

大抵の場合、データ=数字と言われていますが、いったんは「情報を表現した何か」と幅を持たせておきましょう。そして、大抵の場合は現場よりも情報が欠落しています。

そうしたデータから、なぜそうなったのか、そこから何が言えるのかという仮説が生み出せるでしょうか。繰り返しますが、変態で無い限り無理だというのが私の主張です。

結論(事象)とデータが、情報の再現度として100%担保されているならば問題ありません。しかし現実的にそんなことは無いでしょう。ましてや、問いを解くために作られたデータなら再現度はまだ高いでしょうが、実際の場合は「問い」とは無関係に、とりあえず作られた「データ」に過ぎません。

例えば、マーケティングの現場で「なぜ売れたのか?」「なぜ売れなかったのか?」という問いを考えるにあたって、手元にあるデータだけで、規則を発見し仮説を生めるでしょうか? ちょっと難しいでしょう。

デジタルマーケティングにおいて、GAから「何が売れたか」は分かりますが「なぜ売れたか」が分かるデータは取れないはずです。データ無しに規則だけで仮説を述べるのは、単なる一般論に過ぎません。

つまり「問い」に対する、仮説を作りうるデータを1から計測しなければとても仮説なんて作れないし、仮に計測したとしても事象を全て再現しきれていないので、仮説をつくるのはとても難しいのです。

だから私は「データを見て仮説を得る」ことなんて「できない」と断言できるのです。

では、データは何に役立つのでしょうか。

ちなみに、元セブンイレブン鈴木敏文氏は「仮説が先、データが後」という名言を残しました。すなわちデータとは仮説検証に用いるものであり、仮説構築に用いるものでは無いのです。

なぜか。データは、仮説構築できるほど事象を再現していないからです。一方で、構築された仮説を検証するにあたって、仮説が確かならばそれとイコールになるはずのデータという存在は心強い。(それでも帰納法的な証明であって白いカラスが出る可能性はありますが)

例えば、以下の記事から写真を引用します。

図1

よーく見て下さい。

この写真をもとに、ある問題を出します。

いいですか?

隅々まで観察して下さい。

…。


……。


………。


問題です。

写真に写っていた人々のうち、識別できる人相は、男性が多かったでしょうか、女性が多かったでしょうか?

すぐさま答えが導ける人は記憶力が良いか、観察力が良いか、この問題が来ることを予想していたか、いずれかでしょう。

一度、上の画像に戻ってみて下さい。正解は「男性」です。

ガリレオ・ガリレイは「見えないと始まらない。見ようとしないと始まらない」と言いました。多くの物事は「目の前にあるのに、気付かない限りは見えない」ものばかりです。サジェストされて、ようやく気付けるのです。

「仮説が先、データが後」の意味が伝わったでしょうか? 構築された仮説を持ってデータを見れば気付くこともありますが、仮説無くデータを見ても気付かないことが多いのです。

データの使い方を間違えてはならんと思うのです。

データを見て仮説を持つのではなく、事象を見て仮説を構築し、データをもって仮説を検証するのです。事象≠データというのがミソかも。


「観察」から仮説は生まれる

アブダクションを用いて仮説を構築するなら、結論(事象)、規則が必要になります。まずは、データで圧縮するのではなく、結論をまま観察する必要があります。

例えば、以前にAさんから「Bさんに挨拶をしたけど無視された、嫌われているのではないか」と相談を受けたことがあります。「嫌われている」というのが仮説ですね。

しかし、よくよくAさんの話を聞いてみると「無視された」のではなく「挨拶が無かった」のが事実でした。さらにBさんに話を聞いてみると「挨拶はした」ようで、実際には「Aさんの挨拶が聞こえなかった」が事実でした。

(Bさんが嘘をついている可能性もあるのですが)

事実を、事実のまま受け入れる。それこそが観察なのですが、人はどうしても先入観や思い込みを持って事実を判断しがちです。

しかし観察なくして仮説構築はないのです。

ちなみに、最後に宣伝を。

消費者を観察する行為を「消費者理解」と表現して良いと思うのですが、マーケターの皆さんがどのようにして「消費者理解」をしているのかを知るイベントを月1で開催しています。

第5回は、8月24日20時〜開催します。ゲストは才流の栗原康太さん、ブランディングテクノロジーの黒澤友貴さんです。

画像4

もう1つ。「観察」こそが私にとってのテーマなのですが、世の中で観察力が求められる職業って誰だろう…って考えた結果、そのうちの1つは、刑事ではないか?という仮説に辿り着きました。

そこで、元刑事の方に、観察力の磨き方や鍛え方について1時間じっくりお話を聞くウェビナーを開催します。ラジオ感覚でどうぞ〜。

画像5


1本書くのに、だいたい3〜5営業日くらいかかっています。良かったら缶コーヒー1本のサポートをお願いします。