生成AIとは(苦手なこと、限界)

前回は生成AIの仕組みや特徴を中心に見てきました。
次は、苦手なことを見てみましょう。

苦手なこと、限界

判断しない、決断しない、責任とらない

これまで述べた特徴の裏返しになりますが、そもそも生成AIは「超高性能ワープロ」ですから、責任を負わせるなどナンセンスです。
記名して提出する以上、ワープロが勝手に書いた文章だから知らん、と言って通用する世の中ではありません。
例え学生であっても、です。

どこまで行っても、生成AIを通じて世に送り出した文章の責任を取るのは、それを世に送り出した人間です。

原理的に、「正確なことを言う」ことを目的としていない

ハルシネーションの項でも触れましたが、あくまで「うわべを撫でるだけ」で「分かってない」。
AIは「何もわかっちゃいない」んです。

例えば、悩み事の相談をすると、言葉巧みに寄り添って励ましてくれます。
内容も、とても的確だったりします。

ただこれ、身も蓋もないことを言ってしまうと、共感してくれていると人間が錯覚させられているだけです。
AIには感覚や感情、そもそも理解するという概念が、無いからです。
あるのは、「そのセンテンスに関連する内容を予め学習しているか否か」と、「単語の選択における確率の高低、スコアリング」だけです。

平均、既知、無難

生成AIは、莫大な量の文章を事前に取り込んでいますから、一人の人間では到底知り得ないような範囲のことを知っています。
一方で、それは、あくまで誰かによって書かれた既知の情報に過ぎません。
したがって、出力内容は(特に指定しなければ)まだ世にないもの、突飛なアイデアというよりは、平均的な見解、無難な落としどころに寄っていきます。

※アイデア出し自体は可能です。言葉の組み合わせによって、時に斬新かつ、既成概念を打ち破るようなキャッチコピーが出てくる可能性もあり得ます。
※往々にして、アイデアというのは既存のものの組み合わせとか、セレンディピティによって産まれたりするので、LLMがつまらないというものでもありません。

もう少し語るなら、LLMは「思考」自体もしていないのではないか?という論文もあります。

あくまで事前学習した事柄とのパターンマッチングを高精度にやっているだけで、人間が思う「過去の経験や文献をあたりつつ」「あれこれ思索を巡らせて」「演繹法や帰納法を駆使して論理の破綻のないように論拠を組み立て」「他者に伝わるような筋書きにして開陳する」という行為をしているわけではないと。

でも、生身の人間として、「そこまで考える」ことって、そうそうないですよね。
「思考する」「よく考える」とは、いったい、どういう事を言うのでしょうね。

生成AIの制限

著作権との問題

生成AIは、事前に膨大な量の文章を学習しています。
学習対象は、主にWEB上のデータ(個人法人を問わずあらゆるWEBサイト)、様々な文献、論文、記事などと言われていますが、正確な対象や範囲ははっきりとしていません。
ただ、このプロセスは、法的にはややグレーな側面があります。

この事前の学習を、サイトオーナーをはじめほとんどの著作権者は許可していないでしょうし、ましてやそれを元に出力された生成物は、いったい誰のものなのか。
法的にも決着がついていません。

このため、制限されていることも多くあります。
具体的には、既存の歌の歌詞は頼まれても吐かないし、有名な小説も、知っているはずですがそのままは吐きません。
画像生成をさせても、ミッキーマウスやキティちゃんは描きません。

有害コンテンツ

生成AIにはサービス利用規約があって、有害なコンテンツは生成することができません。

具体的には、官能小説のようなものを書かせることはできませんし、グロテスクな画像も生成できません(どちらも、いろいろと抜け道はありますが!)。

これは、技術的に不可能なのではなく、システム側であらかじめ規制されています。
こういった人為的な調整も、相当なされています。
故に、特定の思想や主義主張に、過度に与するような論調で出力しないよう、バランサーが働いています。

こうした、ユーザーが与える指示文以前のところで強力に誘導・制御されている面があります(システムプロンプトと言われます)。
当然、各生成AIは、学習内容の面でも、いかに振る舞うかという前提条件の面でも、その開発者の価値観・バイアスが反映されているとも言えます。

学習元となるデータの多寡から、得意な言語、苦手な言語もあります。
日本語と英語では、随分クオリティに差があると言われていますし、例えば歴史観や倫理観についても、いわゆる「西側」の思想やスタンスが色濃く反映されていると言われています。

生成AIいろいろ

画像、音楽、短い動画

文章の生成についてを主に取り上げてきましたが、同じ原理で画像や動画も生成できます。
与えられたプロンプトに対して、「確率的にもっともそれらしい画像」を作ることができます。

この連載で使用しているイメージ画像も、基本的には生成AIによって生成されたものです。

特定の業務に特化したAI

生成AIのことを別名で「汎用」をつけて汎用AIと言います。
汎用、要は用途を特定しないということ。

これに対して、特定の役割を与え、特定の分野の追加的な学習を施した用途特化型の生成AIというものを作ることができます。
ただ、現状、多くの特定業界向けAIの裏で動いているのは、結局ChatGPTなどのLLMであることが多いです。

人間の代わりに作業を代行させる「AIエージェント」というアイデアもあります。
これも平たく言えば、他のシステムを制御できる「APIという手足を付けたLLM」に過ぎなかったりします。

生成AI関連のニュースを追っていると、日々たくさんの新語・新概念が出てきますが、基本原理としての「LLM」とその振る舞いの特性を押さえておけば、かなり理解しやすくなります。