「検索エンジン最適化(SEO)」から「生成AI最適化(GAO)」へ? 生成AIが自分の作ったデータから学習することの問題から思ったこと

ロボットが空間上に浮かんだコンピュータのGUIを操作するコンピュータグラフィック

ここのところ、毎日のように「生成AI」の話題が上がり、経済系のメディアは「生成AIをいかに活用するか」の議論であふれています。ChatGPT、Bard、Stable Diffusionなどなど……。わたしたちも日々の業務の中で、それこそかつて検索エンジンを使い始めた頃のように、ChatGPTを使うことが当たり前になりつつあります。

生成AIとひと言で言っても、できること、使い方はさまざまですが、今「AI」と呼ばれているものは、「ビッグデータ」の蓄積を元に「情報」を「知識」として、人間の指示に基づいてアウトプットする、という点では共通しているでしょう。要するに、自ら考える「知恵」はない、ということです。そして、AIの蓄積しているビッグデータの「元ネタ」は、人間が作ったもの"でした"。

しかし、今やAIが収集する「元ネタ」は、人間が作ったものに限りません。わたしたちがAIにコンテンツを生成させることで、世の中にAIが作ったコンテンツが溢れ出し、それをAIが学習の「元ネタ」にする、という状況になりつつあるのだそうです。今、生成AIについては「ハルシネーション」、つまり事実とは異なる情報を捏造する現象、端的に言えば「AIが嘘をつく」ことに対する警戒が高まっていて、訴訟沙汰に発展するケースもある中、根拠や出典元を示すことが求められています。

もし生成AIが、このまま「自分がついた嘘」を元ネタに学習し続けたとしたらどうなるのか……先のリンク先記事を読むと、「人間が作成したデータ」が必要なようです。つまり、「人間が生成AIを便利に使うためには、人間がデータを作らなければならない」ということです。こうなってくると、わたしたちがAIを使っているのか、AIがわたしたちを使っているのか、よくわからなくなってきます(笑)。

早い話が「そんなにうまい話はない」という凡庸な結論になるのですが、ここでわたしは「検索エンジン最適化(SEO)」と同じではないか、と思いました。SEOも、昔は「いかに検索エンジンをハックするか」が重視されていましたが、9割以上の検索エンジンのシェアを得たGoogleがハッキングを回避し続け、今や小細工は通用せず、「良いコンテンツを作り続けることに注力する」ことが最適解となりました。

今後生成AIが根拠や出典を示さなければならなくなった時、AIが生成した情報には、「引用元」が明示されることになるでしょう(bingのチャットはそれに近い結果を出しています)。もし、巷間囁かれているように「検索エンジンは生成AIに置き換えられる」としたら、わたしたちが作ったサイトにたどり着くルートは、生成AIが示す「引用元」になるのではないでしょうか。その時、SEOならぬGAO(Generative AI Optimize = 生成AI最適化)の重要な施策は、やはり「良いコンテンツを作り続けることに注力する」ことしかないのではないでしょうか。

有効な答えを返すプロンプトを考えることに血道を上げるよりも、愚直にコンテンツ作りを続けることの方が大事なのではないか……と思いながら、今日もコラムを書いております(笑)。