プロンプト型AI~指示に応じた回答や情報を生成するAIモデル~
AIは「生成」の分野で大きな成長を見せています。 画像生成ではStability AI社の「Stable Diffusion」、OpenAI社の「DALL-E 2」が、言語生成ではOpenAI社の「GPT-3」、Google社の「PaLM」などが話題を集めています。本稿では、これら最新のAIに広く適用されている「プロンプト型AI」について紹介します。
プロンプト型AIとは
プロンプト型AIは、簡単に言うと「人の指示に応じて動作するAI」です。上記の各AIには共通して、AIを操作するために人間から「AIに対する指示」を与える必要があります。
例えば、画像生成AIでは「サイバーパンクな秋葉原を描いて」、言語生成AIでは「フィボナッチ数列を出力するプログラムをpythonで書いて」のような指示をすると、以下のようなアウトプットが得られます。
このプロンプト型AIの興味深いところは、指示の仕方に工夫を凝らすことでAIによる回答品質が変わる点です。
この指示の工夫を「プロンプトエンジニアリング」と呼びます。
Googleで上手く検索する「ググラビリティ」や、DeepLのような自動翻訳エンジンにとって翻訳しやすい文章を与えることに近い概念かもしれません。
そして、人の指示に応じて動作するAIは全て自然言語処理(NLP)技術を基盤としています。 今後、AIのインターフェースは文字や音声に切り替わっていくとも示唆されており、より自然言語処理技術の重要性も増していくでしょう。
プロンプト型AIの仕組み
プロンプト型AIは「事前に大量の情報を学習した超巨大AIモデル」です。
これまでAIは、自作したものや他者が学習させたものを用いて再調整(fine-tuning)して使う方法が主流でした。
しかし、学習に使用できるデータ量やサーバーの強化(計算能力の強化)により、数千万から数億以上のデータで学習させた巨大なモデル(パラメータ数が多いモデル)の開発が可能となり、個別データによる調整を不要とした事前学習モデルだけで様々な推論が可能となってきています。
以下の図を参考に説明すると、右側の個別データを用意してAIに学習させる従来の方式から、左側の個別学習を行わずに指示だけで推論を行えるようになったことがわかります。 また、one-shotやfew-shotの様に、指示にサンプルとなる指示と回答を合わせて与えることで、精度向上なども可能になっています。
[論文] Language Models are Few-Shot Learners
https://arxiv.org/pdf/2005.14165.pdf
プロンプト型AIが拓くビジネスの可能性
今回はプロンプト型AIとプロンプトエンジニアリングについて解説しました。プロンプト型AIはビジネスでは議事録の自動作成やプログラムコードの自動作成、WEBメディアのコンテンツ自動作成などで活用されることが期待されています。
今後は、指示を与えて利用するAIが多くなる反面、指示の与え方に関するユーザー教育も重要になる可能性があります。