林清俊の「ミステリ、プロレス、プロテイン」: コンピュータと文学

Wednesday, May 15, 2019

コンピュータと文学

買い物をするたびにいつも思う。レジの行列はなんとかならないのか。レジ打ちの人がピッと音がするまで機械の前でバーコードをかざす。音がしないときは鳴るまで何度もバーコードの部分を広げて商品を左右に振らなければならない。将棋や囲碁やチェスでは人間の実力を越え、車の自動運転を可能にし、会計士を失職させるくらい優秀なコンピュータだが、こんな単純な作業をこなすシステムが開発されていないところを見ると、案外たいしたことはないなとも思う。

ガーディアン紙に「ロボット作家の台頭」という記事が出ていたが、わたしは眉につばしながら読んだ。案外面白い記事である。

最近 GPT2 というテキストの書けるマシーンが出来たらしい。それを作った技術者は悪意のある利用を避けるため、調整された上位モデルはリリースしないと言っている。

なんだか物騒な物言いだが、じつはこの GPT2 は統計的な分析手法を利用するだけのものらしい。つまり元となるデータがあって、それを分析してつぎに来そうな文章を作っていくのである。

たとえばオーエルの「１９８４」の出だしの文章「四月の明るく寒いある日、時計は十三時を打った」を与えると、こんなふうに続けるらしい。「わたしは車に乗って新しい仕事をしにシアトルへ向かっていた。わたしはガソリンを入れ、鍵を差し込み、車を走らせた。わたしはその日がどんな日になるか想像してみた。今から百年後だ。二千四十五年にわたしは中国の貧しい田舎で教師をしていた。わたしは中国の歴史と科学の歴史からはじめた」

なんだかよくわからない内容ができあがる。一応英語の文法は守っているようだ。しかし「高慢と偏見」の出だしを与えてできた文章は文法も間違っている。

GPT2 に Brexit の記事を書かせるともっとひどい。笑ってしまったのは「英国は将来上位十大学のうち最大三十パーセントまでを失う」という表現で、いくら understatement の得意な英語といえども、ここまでもってまわった言い方はコミックノベルのなかでくらいしかお目にかかれない。

記事の書き手も現状を見る限り、空港で売られている型にはまったスリラーを書かせたり、人間が書いたラフな原稿を編集したり磨きをかけることになら GPT2 は使えるかも知れないと言っている。

われわれはすべては詰まるところデータであると考えがちだ。だから大量のデータを扱うシリコンバリーはなんでもできると思ってしまう。

しかし書くことはデータ処理ではない。「それは表現の手段であり、それを使うということは、あなたがなにか表現したいことを持っていることを意味する。意欲をもたないコンピュータ・プログラムは表現したいものを持たない」「ロボットが豊かな内面を持ち、まわりの世界を理解できるようにならなければ、物語を語ることはできない」と記事の書き手は言う。

これは正直、問題のある発言だ。たとえばすぐれた書き手は豊かな内面を持っているのか、とか、内面、すなわち意識とはある種の錯覚ではないのか、などといった議論が噴出してくるからである。

しかし人間のシンボル利用が、たんなるデータ処理ではない、という点は、わたしも同意する。たとえば GPT2 が作ったという文章を見て思ったのだが、そこには「否定文」が出てこない。もちろん記事で紹介されているのはほんの一部なので、実際には否定文も作るのだろうけど、人間のように否定が使えるかどうかははなはだ疑問である。たとえばスラヴォイ・ジジェクが言っていたが、「ミルク抜きのコーヒー」と「砂糖抜きのコーヒー」はどちらもブラックコーヒーだが、人間はそこに区別を見る。実際、この区別を利用したジョークもある。しかしコンピュータにその区別ができるだろうか。ジジェクはコンピュータの専門家幾人にもこの質問をしたそうだが、だれもはっきりした返事はできなかったという。

ケネス・バークは言語の起源は否定にあると主張していたが、コンピュータがどれくらい否定を、さらには否定の否定を、理解できるのか、興味深いところではある。

このブログの犯人

林清俊
アマゾンからミステリ、ＳＦなどを出版しています。よい作品なのに邦訳の出ていない、小粒の宝石を紹介しようと思っています。「オードリー夫人の秘密」は「英語年鑑」でも取り上げられ、おかげさまで好評をいただいております。「わが名はジョナサン・スクリブナー」は「このミステリがすごい　2020」の書評者の方にも取り上げていただきました。お買い求め頂いた皆様、本当にありがとうございました。これからも独自の視点から作品を選び翻訳してまいります。