見出し画像

人間とコンピュータの関係は競合ではなく、補完である

筆者は「AI・ロボティクス」のスタートアップと紹介されることの多い、株式会社Preferred Networksで最高マーケティング責任者を拝命しています。

B2Bメインに見える同社において最高マーケティング責任者とはこれいかに、と感じられるかもしれませんが、現在開発中の2Cプロダクトのマーケティングをやったり、2B向けビジネス開発をやったりしており、「最高マーケティング責任者」を広義で捉えれば、まぁこれでいいのかなと思いながら、スリリングな日々を才能あふれるエンジニアの仲間たちと過ごしています。

今回のCOMEMOのお題はこちら。

というわけで、ここ数年エンジニアの同僚から学んだことをベースに、自分なりにAIが得意なこと、人間が得意なことを考えてみようと思った次第。

*ここに書いてあることは、大いに同僚から教わったことがベースにありますが、筆者個人の見解であり、Preferred Networks社やの見解ではありません。念の為。

人の仕事を代替するかも、という視点で少し深掘りすると、AIの得意なことはこんな感じの整理ができるんじゃないかと思います。

(1)高速で計算できる

電卓でも、PCのエクセルでも、スーパーコンピュータでも、その基本的な得意技は計算です。人間が紙と鉛筆で行う力技とは比較になりません。
この計算力は、ルールが論理的・明確に決まっている環境で、力を発揮します。例えば将棋や囲碁などはルールが全て規定されている世界の典型だと思いますが、この分野でのAIの躍進ぶりはすでにみなさまご案内の通りです。

(2)人間に理解不可能な形でも、現実世界を捉えられる

コンピュータにセンサーやカメラ、マイクなどをつけると、それらが感覚器官となって、現実を観察することができるようになります。
コンピュータに繋げられる感覚器は人間の五感に対応した可視光線、音などもあれば、超音波、赤外線、放射線などを感知することができるものもあります。これらを計算した値として出力することにより、コンピュータは人間が知覚できない解像度・感覚で世界を観、それらを人間にわかる形で出力することができます。

ここから先、コンピュータは3つの系でそのケイパピリティを拡張します。

(3ーA)動ける

(2)で述べた形(=コンピュータに感覚器官がついたもの)に動力が加わるとロボットになります。そしてロボットに、動くためのルールを入力すると、彼らはそのルールに従って動くようになります。すなわち、人間の代替として役務を提供することが可能になります。
念のために、この段階のロボットは、基本的にルールにしたがって動くことしかできません。つまり鉄腕アトムやドラえもんのようなものではなく、例えば工場に設置してあり、ライン上でものを運んだり接合したりする、アーム型ロボットを思い浮かべていただけると、イメージに近いんじゃないのかと思います。

(3ーB)神のような視座を提供する

(2)で記したように、現実世界を捉えられるようになったコンピュータが複数台連携すると、コンピュータは全体を観る、という能力を獲得します。
人間の身長は大体170cmであり、目と耳はその頭にそれぞれ2個ついているだけなので、彼女または彼が観察し、仕事をできる範囲は、自然とその身体的な制限の範囲内になります。
一方コンピュータはネットワークすることが可能なので、言ってみれば色々なところに分散している人の脳を繋いで、全員が見ている景色をつなぐようなことができます。また、複数のコンピュータから上がってきた複雑かつ多様な現実世界を計算力を使って解析することがきます。
これは現実世界をコンピュータの解像度で、コンピュータの中に再現するようなことであり、デジタルツインと呼ばれるのはほぼこのことであると思います。

(3ーC)学習できる

ここまで記したように、コンピュータは人間の身体的な制約をはるかに超えた能力を持ち得ます。しかしその仕事のコアである計算を、与えられたルール通りにしかできないのでは、環境の変化に対応できません。例えば先述したアーム型ロボットは、想定しないものがラインに流れてきたら(それに対して何のルールも決まっていなければ)止まってしまいます。
また、工場の中のような想定しやすく、かつ変化も少ない環境であれば、ルールも言語化・記述しやすいかもしれませんが、これが現実世界で、ということになると、そこは非常に複雑な環境がごちゃ混ぜになっているので、ルールを記述し切ることが非常に困難です。
そこで「学習」の出番になります。よく機械学習・深層学習などの言葉を聞かれるのではないかと思いますが、これらの「学習」という言葉は、コンピュータが学習する、という意味なのです。
学習には色々な種類がありますが、直観的に理解しやすいものは、サンプルを与えた上で
・お手本をベースに正誤判定する
・分類する
・パターンを抽出する
などなのではないかと思います。
これらはいずれもサンプルの特徴をコンピュータが機能的に抽出し、自らが発見した判断基準=ルールとしていく、ということを意味しています。
念のために、現在のところ、学習の内容や方法は人間が考え、コンピュータに与えるものです。従って、コンピュータが賢くなれる可能性は、この人間によるアイデアがどれくらい卓越しているか、ということに大いに依存します。

(4)複雑なものを最適化できる・制御できる

現実世界を神のような視座で取り込めるコンピュータが学習を重ねることにより、巨大なものや複雑な構造をしているもののデジタルツインを作り、どこをどうしたら何が起きるか、というシミュレーションを重ねていくことができます。
例えば、巨大なプラントは、非常に多くの要素が集まってできており、それぞれをコントロールしなければなりません。これは極めて複雑なオペレーションになるわけですが、AIによるシミュレーションを重ねることにより、全体と部分の複雑な関係を解きほぐし、最適なコントロール手法を導出することができそうです。
また、プラントにおいては、もし事故が起きたら大惨事になるリスクがあるので、一定の範囲を超えた設定を試すことはできません。
しかしこれらのシミュレーションがあるデジタルツインの上であれば、どんな極端な条件でも試すことができます。
しかも、コンピュータは計算が速いので、これらを非常に多くのバリエーションで試し、最善手を導くことができます。
これらにより、人間単体が取り扱える情報量の限界を超えた複雑かつ広範な対象を最適な状態に制御することが、可能になる、という次第。

(5)創造できる

創造は人間の専管事項である、という直感がありますが、筆者はそうでもないのではないかと考えます。

身近な例として、筆者が務めるPreferred Networks社では、誰でも人のキャラクター生成ができるプラットフォーム、Crypcoを発表しました。
詳しくは、こちらのリンクをご覧いただければと思います。

https://www.preferred.jp/ja/news/pr20220426/

さらに創造のコアに近接してみると。
筆者は、新しいアイデア・コンセプトを考えること=メンタルモデルの足し算である、という記事を以前記しました。

この時、メンタルモデル=名前と意味の集合であると考えれば、言語解析により語と語の関係を明らかにすることにより、足し算を自動化できそうです。もう少し細かく言うと、
新しいカフェのコンセプトを考える、と言うお題に対して
(1)考えるべきコンセプト=カフェ+X、と考え
(2)考えるべきコンセプトの意味ーカフェの意味=Xの意味、と変形し
(3)これらの意味を持っている言葉=メンタルモデルXを探す
と言うことは、膨大なテキストのサンプルがあれば、できちゃいそうな気がします。
また、名著ヒットの設計図に示されている

MAYA理論(Most Advanced, Yet Acceptable、すなわち受容できる範囲で最新のものがヒットする、と言う理論)に則れば、ヒット曲のパターンの特徴を解析し、それまでのサンプルになかった新規性を加味すればヒット曲のタネができそうな気もします。
しかし、こうしてできたアイデアの候補やヒット曲のタネが、本当に良いものかどうかの判断は、コンピュータにはまだ難しいのではないか、と考えます。なぜならばこれらを評価の基準となるべきものは、人から好かれるかどうか、と言うことであり、人の好き嫌いというのは個人の経験に紐づく私秘的なことであり、かつ相対的なことだからです。個人史のレベルの解像度で人類のデジタルツインができればそれらも可能かもしれませんが、ちょっと壮大すぎていつ実現できるか想像すらできません。

かなりの字数を使って、コンピュータの得意なことは何か、を考えてきましたが、次に人間の得意事項を考えてみましょう。

(1)少ないサンプルで理解する

「バカ」というメンタルモデルをコンピュータに理解させるのは、非常に難しいと思います。ダサいという多様な概念をサンプルを集めることによって網羅的に集めるには、そのように言われるの相応しい場面や事例を何万例と集める必要があるからです。
また、バカという概念には、知能が低い、というネガティブな意味もありますが、何かに熱中する、というポジティブな意味もあり、この2つの意味にほぼ連関はありません。これを「バカ」という一つの名前のもとに学習させるのは、なおのこと難しそうです。
かたや、人間は数例を提示されるだけで、かなり複雑な概念も理解することができます。
計算するのが速いコンピュータに対して、効率よく理解する人間、という関係である、と言えるかもしれません。
(追記)
この原稿をドラフトした後、エンジニアの同僚と話をしたときに、現在「One-shot learning」というアイデア・研究があり、コンピュータが少ないサンプルで苦手であることは間違いないが、絶対にできないかどうかはわからなくなってきた、と教わりました。

(2)応用する

人間の仕事には、それがどんなものであれ、環境の変化やバリエーションに伴う判断や応用がついてまわります。
想定外の渋滞にどう対応するか、間に合うはずの納期が遅れたらどうなるか、仕事のパートナーが期待値を大きく外れた成果物を出してきたらどうするか、このようなことは予測も対処も難しいので、今のところ学習・計算の対象外なのではないか、と思います。

(3)他者と関係性を構築する

人間には意図や感情があります。そして人は自分の意図・感情やそれらにまつわる経験を使って、本来は見えない他人の心のシミュレーションをすることができます。
このシミュレーションをベースに、人間は他者とのコミュニケーションを行い、関係性を構築し、その結果として「合意」や「共感」などの状態に至ることができます。
意図・感情をベースにした関係性は、人が社会生活を営んだり、仕事を進めていく上で不可欠な資産であり、これらを作り出すのは、人間の専管事項です。
この点は、人の中でも個体差があり、それが不得意な人ももちろんいますが、コンピュータが、コンピュータからの働きかけで、人と自立的な関係構築を行うことはもっと難しいでしょう。

さて、ここまで記して最後にコンピュータは人の仕事を奪うか、ということを考えてみましょう。

例として臨床医の業務=診断と治療について考えてみます。
診断について。血液検査やデジタル画像診断など、データを元に行う判断において、学習が効いたコンピュータに人間が勝つのはかなり難しいんじゃないか、と直感されます。また問診から得た症状の情報からその原因を探っていくのも難しそうです。
これらの業務は機械学習と相性が良く、一方でどんなに優秀な人でも、直近バイアス・確証バイアス・ハロー効果など、人間固有のバイアスからはなかなか逃れられないからです。

逆に、例えば患者の総合的な状態や言動などから病名を探っていくような、データ化・言語化しにくいアプローチ、は、今のところ人間に一日の長がありそうです。これは医師の経験から直感的に判断できている、ということであり、上記 人間の得意分野「(1)少ないサンプルから判断する」「(2)応用する」を援用してなせる業なのではないかと思います。

筆者は若い頃、(アナログの)X線フィルムのマーケティングをしていたときに、胸部読影の名医の先生の心眼に舌をまいたことがありました。筆者は写真を前に説明してもらっても、なぜそこが患部なのか実のところ腹落ちしなかったのですが、先生はたちどころに見抜いてしまうのです。
人間は、後天的に直観的な能力を身につけることができます。
プリミティブなところでは、自転車に乗れるようになる、素振りを重ねることによりバッティングを習得する、などが、もう少し難易度が高いこととしては、外国語の習得などが挙げられると思いますが、もしかしたら先生の心眼は何千という患者さんに向き合ってきたことより獲得された、名人の直感だったのかもしれません。名人の直感とコンピュータによる計算のどちらが強いか、はとても興味があるお題ですが、私にはその答えがわかりません。

表出している症状やデータからその原因を探る、換言すれば「正解がある」診断と比べ、治療は性質が異なります。患者がどのような生活を所望し、そのためにどのくらいの費用をかけて、どのような状態になりたいか、は患者の価値観によります。医師は患者に寄り添いながら、これらを理解し、一人ひとりにとって最善な治療方法を模索しなければなりません。これには応用や他者との関係構築→共感形成の高いスキルが必要であり、コンピュータには少なくともここしばらくは未踏の状況が続くのではいかと思います。

医師の例しか出していないので、それを一般化するのはいささか乱暴かもしれませんが、人がやっているすべての仕事は、大なり小なり上で指摘した人の強み3点、(1)少ないサンプルで理解する(2)応用する(3)他者と関係を構築する、を活かしているのではないかと思います。
部分的にコンピュータによりリプレイスされる部分はあるかもしれませんが、それはコンピュータに仕事を奪われた、とするよりは、コンピュータと協働することにより、仕事のパラダイムが変わった、と考える方が、良いのではないかと、私は考えます。

読者の皆さんはいかがでしょうか?

最後に、最近Preferred Networksから出版した書籍のご紹介をさせてください。これは主にエンジニアがコンピュータの本質と可能性を説いたものであり、私のこの記事よりもかなり緻密に書かれています。筆者もCEOの西川、CER(最高研究責任者)の岡野原との対談、という形で少し登場しています。よかったら手に取ってみてください!


いいなと思ったら応援しよう!