ChatGPTの衝撃ー➁ABEJAの挑戦ー
人とAIの協調により「ゆたかな世界を、実装する」株式会社ABEJAの岡田です。
前回、OpenAIが2022年11月に発表した「チャットGPT」について本コラムで少し触らせていただきましたが、私が代表を務めるABEJAも、Generative AI(生成AI)の領域の1つである大規模言語モデル(Large Language Model、LLM)を「ABEJA LLM Series (アベジャ エルエルエム シリーズ)」として商用化し、ABEJA Platformに搭載して、提供を開始いたしました。
ABEJAが本モデルの開発に至ったきっかけは、2018年10月にGoogleが発表したBERT (バート)でした。
当時、日本ではまだ注目されていませんでしたが、我々はLLMの商用利用ニーズの向上を見越し、4年を超える歳月をかけて、本領域の研究開発を進めてきました。
そしてこの3月、一部顧客のみに限定提供していた本サービスを、より多くの顧客に利用いただくべく、ABEJA Platformに搭載し、本格提供を開始する運びとなったのです。
公開に際して、多くのポジティブなご意見とともに、「ABEJAが研究開発に投資してきたものが、GPT-4やChatGPTの台頭によって損なわれるのではないか」というご意見もいただきました。
しかし、この点において、ABEJAは極めてポジティブだと明言します。
GPT-4やChatGPTなどは、エンタープライズ企業の実運用においてはまだまだ課題があるのが現実で、追加の学習も必須です。
そうした状況の中で、ABEJAの研究開発成果は多くのポイントでそれらを上回っております。
まず、OpenAIが提供するChatGPTなどにおいては、個人情報の取り扱いなどプライバシー上の問題が生じるリスクや、企業の機密情報が社外に漏洩するリスクがあることから、業務上での活用を原則として禁止する企業が増加しています。
一方、デジタル版EMSであるABEJA Platformは、データの幹線道路となります。
ABEJA Platformは、顧客企業の基幹業務のプロセスに導入されることの多いプラットフォームであるため、個人情報や企業の機密データのハンドリングが可能な環境を構築しており、プライバシー保護や情報漏洩などのリスクマネジメントに対応しています。
このABEJA Platformに「ABEJA LLM Series」を搭載して提供することにより、高いセキュリティ環境が確保され、個人情報や企業の機密データを明確にオプトアウトするなどの対応が可能となります。
また、短期的な解決が難しいであろう、情報の正確性や倫理問題などについても、ABEJA Platformにおいて採用している「Human-in-the-Loop Machine Learning(人間参加型機械学習)」のアプローチを用いてアウトプットの適切なレビューと追加学習を継続的に行うことで、差別や偏見を含む不適切な出力結果や明らかな間違えを補正できるほか、より高度な文章の生成を可能とするモデルの最適化が可能となります。
今後は、LLMのモデルサイズを最適化(小さいモデルでも高精度を実現する)することが進んでいくと予想され、これまで大規模化の波からは一線を画していくと考えられます。これは実は、スタートアップにとってもチャンスなのです。
新しいテクノロジーをどう活かしていくか、ブレイクスルードラマが今、まさに今、始まりました。