コンテンツ定量化への道 ~候補空間の探索として生成AIを捉える~

Summary

https://www.pomalo.jp/findings/-ai/でも触れましたが、近年、「Generative AI」とカテゴライズされる生成系AIの精度が飛躍的に向上しました。

生成の対象は2022年現在、文章・音楽・画像・3Dモデルなどがあります。

候補空間とは

このGenerative AIは、入力テキストをなんらかのメディアデータに変換するという技術ですが、見方を変えると「候補空間」からの検索行為であるとも言えます。

この「候補空間」は、解空間・潜在空間・探索空間・・などの言葉で表現されるあり得る解の無限の集合体を指しています。

無限に存在する候補空間は、バベルの図書館をメタファーに説明されることもあります。

「バベルの図書館」には、「23文字のアルファベットにコンマとピリオドの2記号を加えた25文字で表現される文字列の全ての組合せの本」が蔵書されている。その可能態の中には現在すでに存在する本や、これから書かれるであろう本などありうべき可能性の全てが存在している。そうすると本を書くという創造的な行為は、見方を変えれば、「バベルの図書館」の中から一冊を指し示すことになる。コンピュータ・プログラムによって最初のページから虱潰しに探索していけば,こうして今書いている文章も、いつかは必ず発見できるはずです。しかし探索空間が天文学的に膨大すぎて締め切りには確実に間に合わない。そんな不合理な情報処理システムに頼るくらいなら、僕の脳の情報処理システムの方がいくらかマシなはず、という予測に基づいて、苦手な文章を自分で書いています

このバベルの図書館は、無限の本(=解)を蔵書する候補空間の1つ(文字列の候補空間)、と言えます。

この視点から見ると、文章を書くという創作行為そのものは「候補空間からの探索」に置き換えられるのではないかというデザインのテーマが発見されます。

候補空間の探索方法

Generative AIに話を戻すと、Generative AIは、「候補空間」からテキストを使った検索であると捉えることができると思います。

例えば、裏側のロジックは全く異なりますが、テキストによる画像生成AIのインタラクションはGoogle 画像検索に非常によく似ています。

テキストによる検索は非常に簡単ですが、一方で、(当たり前のようですが)テキストによる表現から免れないという非常に大きな欠点を持ちます。

来年、もしくは再来年には動画の候補空間を生み出せる精度の高い「動画生成AI」が誕生すると推測されます。しかし、https://www.pomalo.jp/findings/post-42/で紹介した「古賀」のように、まだ「存在しない感情」を表した動画をテキストによって探索することができるでしょうか。名前がついている、もしくは、テキストによって表現ができるクリエイティブは実は非常に限られています(と自分は感じています)。

テキストを介さない候補空間の探索としては、レコメンド(エンジン)は非常に有効であると考えています。

すでに存在する、Youtube、Instagram、TikTok、Tinderをはじめとした参加型のSNSやソーシャルメディアではその探索能力の一端を感じることができます。

Youtubeには(人生を費やしても見切れない)無限と感じられるくらい多くの動画が存在しています。自分が好きだと思う動画を見るたびに、Youtubeのレコメンドエンジンは学習し、「好きそうな」候補を提示してきます。動画を再生することでYoutubeに学習させ、候補を提案させることは、言語を伴わない候補空間の探索の可能性を感じさせます。

一方、レコメンドによる候補空間の探索にも欠点は存在します。それは、「候補空間を狭める」というレコメンドの本質そのものに起因するものです。

「フィルターバブル」として指摘されますが、提案される(=創造できる)解は、個人の趣味嗜好に合った候補空間の中に閉じたものとなってしまいます。

これは、「表面化されている」趣味嗜好の探索に限定されるとも言えます。人間は表面化されている趣味嗜好に合わせて自らの身の回りをカスタマイズして生きていますが、友人からの薦めで新たに知った(自分の趣味とは合いそうにない)バンドが好きになったり、趣味が全く合わない人を好きになったりします。

このような例えではあまり大きな問題のように思えないかもしれませんが、無限の解が存在しうる空間における探索としては非常に大きな制約となってしまいます。

新しい候補空間の探索方法を探す

一定の成果が求められるコンテンツの制作、について考えると、候補空間を使うことは非常に有効ですが、新しい探索方法が必要ではないかと思います。

候補空間からの探索というコンテンツの制作、の要点を整理すると、

生成されうるコンテンツを一定以上の成果が得られる候補(空間)に絞る
コンテンツ制作者は上記の候補空間の中から解を選び取る となります。

もしくは、AI側からの視点としては揺らぎを持った解の提示(空間としての解の提示)、と見ることができます。

①では、計算によって言語的に表現できる(= データとして表現できる)解を絞り込むことはできますが、「面白さ」「笑えるか」などの抽象的な解であったり、読んでみないと感じられない価値などは、データによる表現ができない以上、落とされる可能性があります。

そこで、空間として提示した上で②によって選択するというプロセスが必要となります。

以上に沿うと、②ではデータで表現できえぬものを探索するインターフェースが必要となります。

どのようなインターフェースが有効であるか、まだ答えはありません。

1つのアイデアとしては、試行錯誤のプロセスを伴った探索が可能なインターフェースが有効ではないかと考えています。

思考がまた少し進んだら、共有したいと思います。

note も書いているので、ご愛顧いただけると幸いです。

Contact