データについての「基本リテラシー」
マネジメントを創った人と呼ばれるドラッカー。
このドラッカーが一貫して熱く説いていたのは
実は「未来」への対峙の仕方である。
特に、印象に残るのは、下記の主旨のことを度々述べていることである。
未来は知り得ないし、今日あるものとも、今日予測するものとも違う。
我々は、既に起こった未来に注目し、それに今日行動することだけができる。("Managing for Results (1964)")
我々の周りには、新たなことが、常に生じている。
そしてこの未知に向き合うのに、データやAIが大きなインパクトを持つ。
ただし、多くの議論はここで間違ってしまっている。
大量データとAIがあれば、未来がある程度予測できるという議論が多い。
だから大量データとAIを持つ企業(GAFA)や国(中国)が圧倒的に強くなる
という議論が一般的になっている。デジタルトランスフォーメーションも
このデータによる予測のためのものと捉えている議論がほとんどである。
これほど間違った議論はない。
まず当然のこととして、未来のデータは存在しない。
データというのは常に過去のものでしかない。
過去のデータによってできるのは、過去の延長を知ることである。
そして、過去の延長と未来の現実は必ず異なる。それが「未来は、今日あるものとも、今日予測するものとも異なる」の意味である。
そこで、未来に向けてどうしたらよいか。
この答を、大量のシミュレーション実験が既に明らかにしている。
それは、以下の行動である。
まず、過去の延長では、どうなるかを知ることである。
これを「予測」と呼ぶ。しかし、この予測は現実とはかならず乖離する。
次に、今日既に起きている、過去の延長からの乖離を明らかにすることである。この乖離のことを「兆し」と呼ぶ。
次に、この乖離、あるいは兆し、がどこに表れているかを調べる。
そして、この兆しが現れていることに、使える資源(人や時間)を
優先的に割り当てて、行動することである。
その結果、従来の延長では、予測や理解できなかった事象についての
データや情報が増える。兆しが単なる偶然のまぐれあたりなのか、
本質的なことが含まれているかについての確度が上がる。
この新たな情報をこれまでの情報に追加し、
改めて、この延長ではどうなるかを知る。即ち予測する。
もちろん、この予測は、また現実と乖離する。
そして、この乖離、あるいは兆しが起きている対象に対し、
資源を優先的に割り当てて行動する。これを繰り返すのである。
これはこれまでのPDCAという考え方と対立する。
だから組織における考え方を変革しないと決して実践されない。
PDCAには、過去の延長からの予測を行うところがない。
従って、その予測との乖離を知り得ない。
PDCAで問題にするのは、計画との乖離である。
計画は、人間の仮説と思惑の入ったものである。
過去の延長からの客観的な予測とは全く異なるものである。
そして、計画とのずれは、往々にして、責任と説明を求められるもので、
行動を求められるものではない。予測と乖離しているというのは、
情報が不足しているということなので、大きな機会が潜んでいる
かもしれないが、それを知るための情報が足りない状態を示している。
従って、説明を求め、責任を求めるものではないのである。むしろ、それに注目して、行動の優先度を変えているかこそが重要なのである。
このように過去の延長と現実との乖離に着目するのは、
実は、「科学」の根幹にある考え方なのである。
それはニュートンによって、科学が本格的に始まった時に、
始まった考え方なのである。ニュートンは有名なリンゴの落ちるのを見て
惑星の運動を説明できる法則を見つけた。
このニュートンが始めた方法が、まさに、過去の延長と現実との乖離に
着目することだったのである。
この乖離を起こす原因を、ニュートンは「力」と呼んだ。
これは当たり前のことを言っていると思う読者も多いと思う。
実は全くそうではない。
もちろん、ニュートン以前にも「力」という概念はあった。
力一杯投げた石は、速く飛び、遠くまで届くことは、
子どもだって知っていたし、力という言葉も知っていた。
しかし「強い力を受けると石は速く飛ぶ」ということこそが
実は、間違っていたのである。もともと飛んでいる石は、
力を受けなくとも、そのまま飛び続けるのである。
これを明確にニュートンは認識した。
即ち、物体の運動における過去の延長とは、
速度がそれまでの一定のまま飛ぶことと考えた。
そして、力を受けると、速度は変わる。加速したり、減速したりする。
力は、過去からの延長に対する変化をもたらすものだと考えたのである。
だから「力→速度」ではなく、
「力→速度の変化」すなわち「力→過去の延長からの変化」なのである。
これを物体の運動に限らず、携帯電話に使う電波から、コンピュータの中で動く電子の動きや雲の動きの予測までに拡げたのが、この400年の
科学の発展だったのである。
もう一度大事な点を強調しておきたい。普通の人の素朴な理解と「科学的な理解」の最も重要な違いはここにある。
普通の人は、速いか遅いか、長いか短いか、
量が多いか少ないかに注目しがちである。
科学は違う。
速さ、長さ、多さの変化と、その変化をもたらすもの
(これを力と呼ぶ)に注目するのである。
速さ、長さ、多さ、というそれ自身に法則性があると、
世界に多様性を認めないことになってしまう。
現実は極めて多様である。一方多様だからといって、
博物学のように個別対象毎の知見しかないならば、科学は必要ない。
多様な世界に、普遍的、統一的な法則性を見出していくのが科学だからである。だから科学的な法則は、注目する量の変化とそれをもたらす要因に着目する。これにより、世界の多様性と矛盾しない形で、統一的な法則性が見出せる。
そして、こういう変化を定量的に取り扱うためにニュートンが
(そしてライプニッツがほぼ同時期に)発明した道具が「微分」である。
ところが、人間や社会の理解には、この変化に着目するという段階に
至っていないことが多い。だから、まだ着目する量自体に法則性を
見出そうとしている。それは、博物学的な知見に留まってしまう。
博物学的な知識は、研究者の関心の数だけ、発見と法則が作れてしまう。
多様な世界に対し、関心の範囲を狭くすれば、その狭い範囲での
特殊な法則性が作れてしまうからである。その証拠に、そのような学問段階では「微分」というツールが出てこない。
例えば心理学や経営学は、まだそのような段階である。
だから心理学や経営学がだめだ、といっているのではない。
むしろ逆である。今後社会にとっても最も重要な学問分野だと思う。
そして、上記のような段階にあるということは、とても大きな
発展の可能性を秘めているということでもある。
そして、いよいよデータの意味である。
データは過去のものなので、過去の延長を知ることしかできない。
これは何人も否定できない原理である。
そして、現実はこの過去の延長、すなわち予測とずれる。
そして、その予測とのずれが起きていることに気づくことこそが
最も重要なデータの意味である。気づいただけでは、何も変わらない。
そして、持てる資源、すなわち時間や人、を使って、
そのずれがおきている対象に行動を起こすことである。
そのような機会に対し新たなデータを生み出すことである。
それにより未知の未来に対する見通しがよくなる。
そして、このように常に未来に向けて見通しをよくしている集団と
常に過去の計画との乖離をPDCAで見ている組織では大きな差が出来てしまう。
ドラッカーは未来を予測することを「夜中にライトをつけず、リアウィンドウを見ながら、田舎道を運転するようなもの」という表現で強く否定した。これは、我々が、予測する時の根拠は、過去の情報やデータにならざるをえないからである。むしろ行うべきは、「既におきた未来」に着目することであり、「予期せぬ成功」に着目することである。
ドラッカーは、ビッグデータやディープラーニングがブームになる
遙か前になくなったが、その洞察は、その後の人よりも遙かに
本質を突いていた。
データを扱うには、このようなリテラシーが必要である。
しかし、現実のデータサイエンティストは、顧客に
「そのデータからの予測は本当に当たるのか」と聞かれた時に、
過去データを学習用と検証に分けて検証したので
大丈夫です、と答えてきた。正直な人なら、過去のデータで
検証されたことが未来の精度をなんら保証するものではないことぐらいは
分かっているが、それ以外の答え方を知らないので、結果として
そのような不適切な答えをしてきたのである。
ここで述べたデータと行動に関する考え方は
データを扱う上での基本的なリテラシーである。
データは、未来を正しく予測するためにあるのではない。
データは、予測と現実との差を通じて、
過去の延長にないことがどこに起きているかを知るためにある。
そして、この予測不能な対象に行動を起こし、
世界をよりよく理解し、前進するためにある。
これこそが、あらゆる人が知るべき基本リテラシーなのである。