ChatGPTの衝撃ー①概況ー
人とAIの協調により「ゆたかな世界を、実装する」株式会社ABEJAの岡田です。
「不気味の谷」という言葉をご存知でしょうか?
「不気味の谷」とは、ヒューマノイドなどのロボットが人間に似てくると、ある段階で急に不気味に感じられる現象を指します。1970年に東京工業大学名誉教授の森政弘さんが提唱しました。
私はもともとの専門がコンピュータグラフィックス(CG)ということもあり、この言葉をとても身近に感じていました。
CGの世界においては、1995年に全編で3D(3次元)CGを採用した映画トイストーリーが発表されて以来、爆発的な速度で技術進化が発生しました。今では、多くの方が映画やアニメなどで実感される通り、実写なのかCGなのかを区別することが難しいレベルに達しています。
そんな進化の過程の中で、不気味の谷という時期がありました。
極めてロジカルでは無いのですが、見ていると心がザワザワするのです。
なんとなくキモチワルという感覚でしょうか。
そして、しばらくするとさらに技術進化が起こり、このザワザワが無くなっていくのです。
私はまさにいまAIにおいて、この過渡期に差し掛かっているという認識でいます。
OpenAIが2022年11月に発表した「ChatGPT」を発表しました。
ChatGPTのベースにある技術や取り組みは以前から存在しており、GPTはGenerative Pre-trained Transformerの頭文字をとっています。
2018年に初期バージョンであるGPT、2019年にはGPT-2、2020年7月にはGPT-3がそれぞれ発表されています。
基本的には、与えられた文章から虫食いになっている一部文章を予測する深層学習を用いた大規模言語ファンデーション(基盤)モデルです。
大規模言語ファンデーションモデルについては、2018年に発表されたGoogleのBERTなど、OpenAI以外の研究機関や先駆的企業から多くの発表がなされていました。
そのような状況の中、2018年の時点で大規模言語ファンデーションモデルが、NLP(Natural Language Processing)という研究領域だけでは無く、商業的・ビジネス的にほぼ間違いなくブレイクスルーを迎えるだろうという「確定された未来」はある程度予想していました。
これは多くの方々も同じでしょう。
しかし、課題は、果たしていつその未来が訪れるのか?という予測が極めて難しいというものでした。
もし10年間ブレイクスルーが無ければ、10年間赤字を垂れ流すというかなり辛い状況です。
とはいえ、実際にやってみなければ研究開発は進まないということもあり、ABEJAは、着実に必要となる部分から準備を進めました。
まず前提として、大規模なモデルの研究開発を行うためには、莫大な計算が必要となるため、コンピューティングリソースの確保が重要です。
ABEJAでは、オンプレミスとクラウドを並行的に利用する環境を構築し、SIX2022において、NVIDIA A100 を合計960機使用した日本語で最大規模の13BパラメータによるGPT-3の学習を完了したことを発表しました。
また、一部の学習済みモデルは、Hugging Faceにてオープン化しました。
開発経緯や完成モデルの出力例などは、ABEJAのブログで公開していますので、ご興味がある方はこちらからご一読ください。
https://tech-blog.abeja.asia/entry/abeja-gpt-project-202207
このような状況で、私として極めて嬉しいニュースがChatGPTです。
結構な時間を研究開発に当てなければいけないかなと思い描いていた中で、たった1年足らずで驚愕のブレイクスルーが起きたのです。
それは、まさに不気味の谷を一気に迎え、そして越えようとしている瞬間でもありました。
もちろん現状は、回答の正確性やソースとなる情報の信頼性、倫理的観点におけるリスクが多く挙げられています。
ChatGPTの回答は、インターネット上の情報に基づいているため、正確でない、もしくは不適切なデータを学んでしまった場合、アウトプットされる情報もそうした内容になってしまう、というのは避けられません。
また、エンタープライズの実運用においてはまだまだ課題があるというのが現実で、チューニングも必要です。
現時点のChatGPTを自在に活用するには、ハードルがやや高いのが現実なのでしょう。
しかし、これらの部分について、少なくとも私はかなりの部分で楽観的です。
実際に、短期的に多くの部分で技術的な解決策が提示されていくでしょう。
また、短期的な解決が難しいであろう、情報の正確性や倫理問題などについては、人との協調によって乗り越えることが可能だと考えています。
実際に、ほぼ全てAI活用の仕組みにおいては、人との協調は必須であり、AI単体で解決する手法は現実的ではないでしょう。
今回のテーマは、多くの読者の方々が非常に興味深いかと思いますので、シリーズ化しようと考えています。
まずは、私がどういう流れでこのニュースを読んだのかという概況を書かせて頂きました。
(もちろん、技術者的な細かい観点もありますが、読者はもう少しビジネス寄りの方々かと思いますので、少しビジネスターゲットの文章にしています。)