コンテンツ定量化への道 ~生成と評価とチューリングと~

Summary

コンテンツの自動生成や評価についてもう少し考察してみたいと思います。

なんらかのビジネス的目的が存在する場合、自動生成を実現するには「生成」と「評価」が常にセットで実装されていないと機能しません。

無限に生成できる生成器だけでなく、その中から目的を果たし得るコンテンツをフィルタリングする評価器(分類器)が存在して初めて、自動生成が達成されます。

一定の水準で生成が可能となった今(もしくは近い未来)、より難しい問いとなるのは、この評価器(分類器)の方になると考えられます。

2023年現在、生成と評価の両輪が(人間の介在なしに)高いレベルで機能している分野は、Web広告でしょう。

自動生成された広告は「クリック率」という評価を通して、即座に評価されます。この学習を通して、クリック率の予測器を作ってしまえば、生成と評価(=予測)を同一の環境の中で高速に行うことができ、「クリック率の高い広告」を高精度に自動生成することができます。

これは、Web広告の露出量が多く大量のABテストが可能であること、クリックという明確な評価が 即時 行われるという性質に依るところが大きいです。

さて、ここで、チューリングテストの話をしたいと思います。

1950年に発表された論文『計算機械と知能』の中で、チューリングは次のような「ゲーム」を提案している。参加者は三人。一人は男性(A)、一人は女性(B)、もう一人は質問者(C)である。質問者は、他の二人の姿が見えない壁で隔てられた部屋にいて、声が伝わらない手段によって、AやBに質問をする。質問者の目標は、他の二人の性別を当てることである。Aの役割は、女性を演じて質問者を騙すこと、Bの役目は、素直に応答して質問者に協力すること(つまり自分が本当に女性だとアピールすること)だ。チューリングはこれを「模倣ゲーム(イミテーション・ゲーム)」と命名した。彼は次のように問う。このゲームにおいて機械がAの役をしたとき、何が起こるだろうか、と。つまり壁を隔てた向こうの男女の代わりに機械と人間がいて、質問者はそのどちらが人間かを当てようとするのだ。このとき、「質問者が間違った判断をしてしまう機械を作ることは可能だろうか」。要するに「模倣ゲーム」において、人間を演じきる機械を作ることはできるだろうか、とチューリングは問うのだ。

この、チューリングテストの概念はまさに生成と評価の話と繋がります。

Web広告の例で言うと、クリックの予測器は人間のクリック意向を「模倣した」機械であると捉えることができます。

アラン・チューリングはイミテーション・ゲームについて、以下のように述べます。

アラン・チューリングは、「模倣ゲーム」を提唱した論文 『計算機械と知能』(1950)の中で、人間の心を「玉ねぎの皮」にたとえて、こんなふうに語っている。人間の心、あるいは脳の機能の少なくとも一部は、機械的なプロセスとして理解できるはずである。ただし、純粋に機械の振る舞いとして説明できるのは、「本当の心(real mind)」のどく表層に過ぎない。それは、隠された「芯」に辿り着くために剝ぎ取られなければならない、表面の皮を 一枚、一枚、皮を剥ぎとりながら、芯に近づいていこうとするように、機械で説明できる心の機能を一つずつ「剥いて」いけば、私たちは次第に「本当の心」に近づいていくことだろう。

このチューリングの考察は、現在の「自動生成」を取り巻く環境、そして課題を明快に表しているように感じます。

現在機能する「評価器」は、チューリングの言うところの「表層」と考えることができます。

例えば、広告のクリックは、(人間の深いレベルの思考や心理変容を挟まない)「反射」に近いレベルの反応、と言えます。

Webの世界にいると忘れがちになりますが、本来、何らかのコンテンツに対する反応は「①刺激→②心理変容→③行動」と変化するはずで、Web広告で言うと「①広告を見る→②買いたい(見たい、行きたい、..etc)と思う→③広告をクリックする」となります。

しかし、Web広告においては、せいぜい1秒程度の(瞬間的な)接触でクリックするか否かを判断しており、刺激に対してほとんど②をほとんど挟まずに反応する、本能レベルのもの、と考えることができます。これは、チューリングの言うところの「表層的」な反応と言えるでしょう。

逆に言えば、データの取得が可能である①と③のみで説明ができる行動(=「表層的」であるもの)、刺激に対して反応までの速度が短いものは模倣が可能であると考えることができます。

では、玉ねぎの内側の皮の反応はどのようなものでしょうか。

「本当の心(real mind)」の反応と言えるのは、例えば、「感動」などが当たると自分は考えています。

音楽や映画を鑑賞した時の深い感動。これは非常に人間的なものであると思います。

さて、この「感動」は、模倣することができるのでしょうか。さらに言うと、人間の反応を模倣した評価器を作ることができるのでしょうか。

問題は、人間的であればあるほど(玉ねぎの内側に行けば行くほど)、「①刺激→②心理変容→③行動」における②の割合が高まる、という点です。

いい音楽を聴いた時、「感動」という②心理変容があっても、③行動のレベルまで落ちない、もしくは人それぞれ行動を示す、のではないでしょうか。

人間の反応を模倣する機械に音楽を聞かせても何も反応(行動)が返ってこないことが考えられます。

玉ねぎの内側に訴えるようなコンテンツの本質的な「質」は、模倣機械を作ることができるのでしょうか。

興味深いことに、チューリングは、さらに以下のように続けます。

目指すべき「芯」が、端から存在しないとしたらどうだろうか。 皮を剥いていった果てに、最後にあるのが、中身のない皮だけであったとしたら。そのとき人は、心ははじめからただの機械であったと、知ることになるだろう。このようにチューリングは論じるのである。

コンテンツの本質的な「質」を評価するためには、人間をどこまで「機械的」であるかを定義することと近いかもしれません。

最後に、チューリングとある意味で真逆のアプローチで研究を進めた岡潔の思考を引きたいと思います。

岡潔もまた、数学研究を契機として、心の究明へと向かっていった。ただし、方法はチューリングのそれとは大きく違う。チューリングが、心を作ることによって心を理解しようとしたとすれば、岡の方は心になることによって心をわかろうとした。チューリングが数学を道具として心の探究に向かったとすれば、岡にとって数学は、心の世界の奥深くへと分け入る行為そのものであった。道元にとって禅がそうであったように、また芭蕉にとって俳諧がそうであったように、彼にとって数学は、それ自体が一つの道だったのだ。

心は玉ねぎのように、手で持つことができるような、動かぬ実体ではないのである。知ろう、わかろうとするこちらの姿勢が、そのまま知りたい、わかりたい心のあり方を変える。心を知ろうとするときに、知りたいこちらと、知られるあちらを、分けることなどできないのである。

岡は心を論じるときに、野菜の皮より、種子を語った。種子は育ち、大きくなる。その変容する力に種子の生命がある。玉ねぎを生んだ種子。その種子を包み込む土壌。玉ねぎの本質はその空間的「中心」よりも、むしろその外、その過去の方にある。心の外。心の過去。物理的な肉体の中に閉じ込められない、心の本来の広がりを取り戻そうと、岡は「情緒」という言葉に、新たな意味を吹き込もうとしたのだ。

参考:数学する身体:森田真生, 2018

note も書いているので、ご愛顧いただけると幸いです。

Contact