[世界についての知識]

で、そういう問題をいろいろ解いていたんだけど、よくよく考え ると、こういう簡単な問題からちょっと複雑な問題に変えてやると、少し違う 問題の様相がでてくるわけですね。つまり、問題の枠組みは全く一緒で、これ が初期状態で、積み木がばばばとおいてあって、ちょっとサイズが違う積み木 があってここからこれを作る。で、ロボットにはできる行動が決まっているか らそれらをどんどんエミュレートしていくわけで、一見とけるようにみえるん ですが、やみくもに解かすと、途中の状態でこういう状態をつくってしまうん ですね。えっとBの上にDをのっけて、その上にAをのっけていうことをやるん ですが、実際こういうことをやった時には当然、これが、かくっと下がってしま うんですよね。こけてしまうんですよね。こういった現実に生じないような状 態まで作れてしまうわけですよね。つまりここでは何がおこっているかという と、こういう状態が実は不可能なんだよ、ということを知ってないとダメなん だ、ということになりますよね。つまりこれは物理法則からこういう状態には なりえなくって、こうなると下に落っこちますよ、とそういう世界についての 知識、これは行為に関する知識じゃないですよね。行為っていうのはある状態 があって、その行為をすることによってどういう状態に移るかということの知 識だったんですけど、これ自身は行為とは全然無関係に世界自身がある法則に 従って動いていて、僕らはそれらに関して何かをしっている。つまりこういう 状態は僕らの世界に関する知識からリジェクトされる。複雑な問題を解こうと すると、こういう世界についての知識も僕らの頭の中に、ロボットの頭の中に 何らかの形で表現しておかないとだめだ、ということになる。実際この問題は いろんな形でとけて、例えば一部分だけ先に作っておいて全体をのっけるとか、 あるいはこういう状態をさけるために、ここにひとつ余分な積み木を用意して やって落ちないようにしてやって、それからこれをのせて、これをとる、と。 つまりつっかえ棒みたいなやつをいれるということですよね。そういうことを 実際に計算機に発見させようと思うと、先ほどいったように行為に関する知識 だけでなくて、僕らが世界に関してしっている物理的な法則についてもしって ないとだめだということになります。それも物理学の知識をそのまま僕らに与 えておいてやって、これが力学的バランスがつぶれるということを覚えさせて おけばよいのか、あるいは僕らが実際に積み木の問題を解くときに方程式を解 いているという感じはしないですよね。これがぱたっとおちるというのはもう ちょっとシンボリックな形で表現されているような気がするでしょ。力学系の 計算を頭の中でやっているというよりももうちょっと違う形で表現されている わけだから、この世界にかんする知識もただ単純に物理学に関する知識ではな くて、世界について僕らがしっているようなことをなんらかの形で表現してや る。いう話になって、実際に物理学とは違うモデルでこれがバランスが崩れる ということを記憶させてやればよい。こうして、行動に関する知識から、世界 に関する知識にシフトしていくわけですね。つまりより複雑な問題を解かそう とすると、行為に関する知識だけじゃなく世界がある種の規則に従って動いて いるということをロボットがしってないとだめで、それを使える形で表現して おいてやろう、という話になります。

そういう世界に関する知識っていうのは非常に大げさな言い方ですが、必ず しもこういうロボットの問題だけじゃなくて、人工知能の他の話題のところで もでてくるわけですよね。それはどういう話かというと、例えば僕らの分野で いうと自然言語の理解という分野があるんですが、それは言葉を理解できるよ うな計算機を作りましょう、と。つまり、自然言語でもって人間とやりとりで きるようなシステムをつくりましょう、ということなんですが、そういう分野 をやっていると、実は非常に単純な文でも非常に難しいということがわかって くるんですよね。例えば上の文章は I saw a girl with a telescope.という 文章ですよね。次の文章はI bought a car with three wheels.という文章な んですが、これ文法的にこれ非常に似ているんですよね。これ実際にはこの2 つの文章は違った構造をもっています。I saw a girl with a telescope の場 合は望遠鏡で少女をみた、つまり、sawにかかっているわけですが、このI bought a car with three wheelsという場合には、みっつの車輪を使って車を 買ったという解釈は難しいんですね、実際には with three wheelsというのは a car にかかっていて、私はみっつの車輪をもった車を買った。ですから、こ の with three wheels やwith a telescope というのがどこにかかっている のか、ということを決定しようとすると、to seeというアクションと telescope という道具が、どういう関係でつながるか、あるいは carという 名詞で表現される実体とthree wheels という名詞で表現される実体とが現実 世界でどういう風につながるかということを知ってないと、単純に文法だけを 使ってやっているとどちらにもかかってしまうという二つの解釈ができるわけ、 ですね。結局この二つの区別をするためにはseeというアクションというのは telescopeで行われるけど、three wheels では行われないとか、あるいはa car というのは三つの車輪というのを部分としてもっている、そういう知識が ないとこの二つの文の解釈はできない、というわけですね。あるいはこれもよ くあげられる例なんですが、「黒い瞳の大きな女の子」という例なんですが、 これはものすごい多くの構造が考えられるんですね。つまり、どれぐらいの曖 昧さを持つかっていうと、この黒いっていうのは女の子を修飾しているかもし れませんね。瞳が大きくって、まぁ、黒人の子かもしれないので黒い女の子と いう可能性がありますね。それからもう一つの解釈は大きいっていうのが瞳を 修飾しているんじゃなくて体が大きいということを意味しているのかもしれま せんね。つまり、瞳は黒いんだけど、体が大きいということを意味しているの かもしれませんね。それから標準的な解釈として、瞳が黒くってかつ大きいと いう解釈がありますね。それから、女の子っていうのも微妙な表現で、女の子っ ていうのが一つの解釈なんですけど、もう一つ、女の人がいて、その人の子供っ ていう解釈がありますね(笑)。だから黒い瞳の大きな女、の子という解釈も あるわけですね。そういう解釈も認めると、今度は黒いっていうのが子供にも かかるかもしれませんから、瞳が大きいのは女で、黒いのが子供という可能性 もありますよね。それから大きいのは女で、黒い瞳というのは子供であるとい う可能性もあるわけですよね。だから黒い瞳の、大きな女の、子という解釈、 かなり無理がありますよね(笑)。ま、実際にはものすごい可能性があるわけ ですよね。実際にはこういう表現が使われている時には、これだけで使われる ことはないわけですよね。実際にはある状況があってその中で解釈されるわけ ですよね。話の中で女の人がでてきていて、その人が子供をつれていたら、女 の、子という風に解釈されるわけだし、瞳の大きい、小さいという話があった ら、それが一つにまとまって、体を修飾したりはしない、と。ある状況を考え るて、つまり、この言語表現が使われている状況まで考えると、この表現は一 意にしぼれてしまうわけですよね、実際。あるいは同じ表現なんだけど、「黒 い馬力の大きなト○タのスポーツカー」、っていうのは、さっきの表現と似て いるんだけど、ところがこちらだと状況まで考えなくても一意に定まってしま うんですね。まぁ、ト○タが黒いっていうことで、なんか汚職をしているとか メタフォリカルな表現をしていれば別ですけどね(笑)。そういう解釈を認め ないっていうことにすると、一意に定まりますよね。つまり、黒いも大きいも ト○タもスポーツカーにかかる、と。これは状況がなくってもト○タがどうい うものであるか、とか、スポーツカーがどういうものかっていうこととか、馬 力っていうのが車とどういう関係を持つのかっていうこと、つまり名詞だとか、 形容詞だとかとは違う、各々の単語が何を表現しているかっていうことを知っ て、その表現されているものが現実世界でどういう役割をもっているか、とい う現実世界の知識があれば、この解釈は一つに絞り込まれていくわけ、ですよ ね。つまり自然言語に僕らが関していくっていうことを、実際計算機の中でで シミュレートしていこうとすると、これらの解釈を一意にしぼっていこうとす ると、ここに使われた現実の世界っていうものをなんらかの形で内化しておか なければならない。だから単純な処理、さっきでてきたプラニングだとかいう ことになると、こういう知識っていうのはいらないんだけど、自然言語処理に なると知識の問題がかなりexplicit にでてくる。また、プラニングでも、ブ ロックが、かくって落ちるということを実際に表現しようとすると、こういう ある種の物理法則が知識が必要になる。で、よくある例なんだけど、The soldiers shot the women and they fell downという文と、The soldiers shot the women and they left the villegeという文を考えた時、このtheyが 指している対象が変わってしまうんですよね。例えばこの文を他の言語に翻訳 しましょう、ということを考えると、フランス語とかスペイン語のように指し ている対象が男性か、女性かで形が変わってしまう、例えば代名詞とかが変わっ てしまうという言語では、このtheyが何を指しているかわかってないとうまく 訳せない、ということになりますよね。ですが、この文章の中では兵士がこの 女の人を撃ったと、それで倒れた、とつまり兵士が倒れたとは、まぁ、撃って 倒れるということもあるかもしれませんが、普通撃った人が倒れるとは考えに くいですよね。で、やっぱりこのtheyというのはwomenを指していると。それ からThe soldiers shot the women and they left the villegeという文の場 合、普通の解釈としては、このsoldierが村を去っていったと解釈するわけで すよね。ということはこのtheyというのがどちらを指しているのかということ をわかろうとするには、shootingした後どういうこが起こるかということに関 する知識が必要になるわけですよね。つまり、こうい複雑な知識という問題が、 言語という対象で考えた時に現れてくるというわけですね。それで1970年代の 半ば頃からは人工知能の問題は探索の問題から知識の問題にシフトしていくと いう感じになるわけですね。あとは、残りの4と5の話をしていきます。(1 0分休憩)

構造主義的言語学のことを少し話しましたが、例えば、アメリカインディアン の言語のモデルを作るときに、インディアンのしゃべる言葉をどんどん記述し ていって、そこから帰納的に規則を抽出する、そういう言語学っていうのもや はり同時期にパラダイムシフトを起こすわけですね。で、それがチョムスキー 革命というやつで、これが人工知能の方にも大きく影響していきます。構造主 義的言語学というのも行動主義の流れをかなり含んでいたわけですね。つまり、 観察できるデータだけを問題としましょう、と。で、僕らの心の中を思弁的に 議論するのはやめましょう、というのが行動主義だったわけですけど、つまり、 観察され検証可能なデータだけを対象にしてモデルを組み立てていきましょう、 ということだったわけですね。で、そういう時にチョムスキーがでてきて、メ ンタリズムにシフトする、つまり僕らの心の中を喋りましょう、という話にシ フトします。それはどういうことかっていうと、そういう個別的な、例えば日 本語の文法一生懸命書きましょう、とかインディアンの文法がどんな文法になっ ているのか、一生懸命書きましょうとか、ある特定の言語をとりあげて、その 文法を書く、というのは科学ではない、と。そんなことをやっても一向に面白 くないと。結局言語学で面白いのは何かというと、そういう言語というものを 処理する人間の方に焦点をあてた時に面白くなる。そういう文法を処理する僕 らの心の機能みたいなもの、ですね。そこを問題にするのが言語学の本筋であ る。そういう意味で彼にとっては言語学というのは心理学の一部であるし、究 極的には生物学の一部になる、と。僕らの中にもっている機能とは何かという ことを問題にしましょう、ということで問題をシフトしていくのですが、それ をチョムスキー革命と呼びます。特に彼がしつこくいったのは、インディアン の言葉をデータとして、ばーっと記述したと、で、そこから文法を作るってい うんだけど、本質的に問題なのは、実は言語というのは無限なんだと、つまり、 僕らの英語、日本語の文章というのはいくらでも作りえて、いくらでも長くて、 見たこともないような文も作れて、で、それは結局無限集合というわけなんで すよね。いいですか。無限集合を有限で近似して、実際に観察された事象だけ をとりだしてきて、そこからぐじゅぐじゅ、やってても無限集合の本質はとら えられない、という感じのことをいったわけですね。それから僕らの頭の中っ ていうのは有限ですから、英語、日本語の可能な文章が無限だからといっても、 僕らが何か新しい文をぱっと見せられて、その文が正しい文かどうか判断しな さいっていわれると、native speakerであれば、これは日本語としておかしい とか英語としておかしいとかすぐいえるわけですね。ということは見たことも ないような、つまり無限の集合の要素を一つとってきたときに、それがその言 語に属するかどうか判断できるっていうことは、僕らの心の中にその言語に関 する有限の記述があって、それが無限集合を規定しているって考えたわけ、で すね。で、そこで情報科学の人だとすぐに気がつくのは、そういう無限の集合 である言語を記述する枠組みとして、regular grammarかcontext grammarか context sensitive grammarかtype-0のgrammarなどのchomsky hierarchyがあ りますよね。その話はしってますよね。で、結局このいくつかの違う形式言語 を使っても、いずれも無限の集合を規定できるわけですよね。ところがその言 語の複雑度がみな違うわけでしょ。そうすると人間の言語が無限の集合だとし たときに、結局人間の言語っていうのはどのクラスの言語なのかっていうこと が問題なわけですね。それはregularでかけるのか、context freeでかけるの か、それともcontext sensitiveでないとかけないのか、とか、あるいはもっ と一般的な型でないと書けないのかっていう話になりますよね。で、これは結 局非常に面白い問題を提供していて、彼の主張としましては、個別言語の文法 というのを考えるよりも人間が種として共有する言語能力、種っていうのは生 物の種としてね。例えば、日本語、英語、ドイツ語、フランス語といろんな言 語があるけど、これらの言語が一つのクラスに属しているってことがいえたら、 人間の言語の形式を処理する能力はどれくらいの計算を必要とするようなもの なのかっていうことが同定できるようになるわけですよね。で、一番考えにく いのは、例えば日本語はcontext sensitiveでフランス語がcontext sensitive でないっていうことがわかると、つまり言語によってクラスが分かれると彼の 主張はなりたたなくなるわけなんだけど、彼の仮説っていうのは人間の脳って いうのはどこかに言語に特定されたような処理機構っていうのがあって、その 処理機構っていうのはどの言語にも共通して使われているっていうやつで、特 に日本語がむずかしいクラスに属したりしているってわけじゃない、と。それ は日本の子供がフランスにいったら、フランス語が習得できるっていうように、 つまりバイオロジカルにはあらかじめ日本語、フランス語とかが頭の中にあるっ ていうのじゃなくて、言語の処理機構そのものがはいっていると。だから初期 のチョムスキーの興味っていうのは、人間の自然言語っていうのが、言語のク ラスでは共通しているっていうことを一生懸命やろうとしたわけですね。人間 の言語能力、つまり僕らの頭の中にある処理処理の機構がどういうクラスの言 語を処理できるのかっていうことを研究しよう、と。個別言語の文法を書くの ではなく、文法規則の形を同定していきましょう、っていう話になるわけです ね。あるいは、僕らの言葉っていうものを処理するときに必要となるような計 算能力はどんなものなのかっていうことを同定しましょう、と。あるいは、個 別の言語によらず、いろんな言語を学習できるっていうことは、どういう学習 能力にそれが支えられているのかっていうのを研究しましょう、と。しかも、 人間の言語でもっと気持ち悪いのは、人間の子供っていうのは、おそろしい速 さで言語を習得していくわけですね。それもかなり不完全なデータから習得で きるわけ。つまり大人が喋っているのをきくわけなんだけど、文法的な文をしゃ べっているわけじゃなくて、断片的なデータですよね。しかもそれをものすご くたくさん聞くっていうわけじゃなくて、だいたい、一歳か二歳ぐらいから喋 りはじめるわけですよね。かなり局限されたデータだけで喋り始めるわけだと。 しかも親が間違った文法を修正しているのかっていうと、そんなには修正され ていないんだよね。修正することもあるんだけど、そんなに頻繁には修正をし ていない、と。結局、彼の仮説は何なのかっていうと、僕らの言葉を使う能力っ ていうのは、個別な文法そのものは、僕らの頭の中に入っていないんだけど、 かなりの部分がすでに処理機構としてビルトインされていて、つまりそれが universal grammarと呼ばれていて、実際に子供がやっているのは、その universal grammarと呼ばれているやつのいくつかのパラメータを埋めるだけ だと。で、その言語に関する文法は、ばっと習得される、と。で、内部の構造、 言語の処理に特化した部分を、つまり処理機構がどういうものであるのか、と いうことを、計算のモデルとしてはどういうモデルになっているのかっていう のを特定しましょう、っていうのが言語学の基本的な課題ですよ、といったわ けですね。それは構造主義言語学からすると、ものすごいシフトなわけですよ ね。つまり実際の言語データでもって、何か規則を見つけだしてくるとか、そ の規則はある特定の言語に関する規則だったりするわけですけど、そこはまっ たくやめてしまって、僕らの心が計算する、計算の能力みたいなものを同定し ましょう、いう話に問題を変えたわけ、ですね。それは二つの意味で重要で、 一つはそういう行動主義的な言語学から、一気に僕らの心に関する問題にきり かえた、と。つまり頭の中でどういう計算が行われたかということに切り替え た、と。で、もう一つは、言語っていうのは、特に言語の形に関する理論って いうのは僕らの一般的な知能っていうのじゃなくて、言語に特化した処理機構 があって、そこで処理をされている、っていうことをいったのが一番大きな話 なわけなんですが、 [中央系と周辺系] そういう話をもっと普遍していうと、これも人工知能の中 でよく使われる言葉ですが、中央系と周辺系っていう議論があって、いままで の問題解決だとかは、僕らの中央系で行われているっていうことで、中央系で 行われているっていうのは、僕らが自覚的に処理するみたいな、例えば、僕が あの学生を殴ろうと思ったら(笑)、そういうプランを立てたとしたら、あの 学生っていうやつをみて、そういう風に自分は行動しないとだめだっていうこ とのプランを立てる、と。で、そのプランを立てるっていうのはかなり自覚的 に行われている。前に話したように、この実際の状況をまずいったん頭の中に 内化して、自分がとれる行動と組み合わせて、頭の中で計算して、そのプラン を作って、その行動をしていく、と。で、僕らが一般に知的と考えている部分っ ていうのが中央系ということになるわけ、ですね。ところがチョムスキーとい うのは言語能力というのは中央系ではない、と。例えば言語の文法を習得するっ ていうのは、数学の問題を解くっていうのとか、あるいは物理学の問題を解く のを勉強するというような、僕らの一般的な知的能力のところでやられている のではなくって、言語に特化した、特別な処理機構で行われている。それは周 辺系と呼ばれているやつで、例えば、視覚、つまり僕らがものをみるっていう のも、これはかなり自覚的にこれは机であるという風に認識するっていう部分 はあるんだけど、それ以前に、例えばここは線をなしている、とかどこに影が あるとか、そういう部分っていうのは視神経から大脳にいくまでに、かなりの 処理がやられてしまっているわけですね。つまり、信号として処理されて、実 際にそれと意味を結びつける、つまり線とかという意味のデータからこれは机 ですよ、という認識をやる部分は中央系でやられるんだけど、そこにいたるま でにかなりの情報処理がやられている、と。あるいは聴覚でも、単語と結びつ けるっていう段階になると、かなり言語的な部分に結びついていくんですけど、 それ以前は信号処理としてやられているんですよね。で、彼の主張っていうの は、実は言語処理っていうのは、かなりの部分、そういう僕らが意識的に情報 操作をしているんじゃなくて、言葉に関するかなり特化した神経網があって、 そこでかなり処理をされてしまっていて、それは僕らが自覚的に表象を操作す るっていう能力以前に行われてしまうと。いう話になります。ですから、初期 のころは、人工知能っていうのはこれらを全て取り扱っていたんだけど、徐々 にそれが分化していって、例えばものをみてそれが机だとわかる、だとか、あ る絵をみてこれはどういうものであるのか、ということがわかるっていう、そ ういう認識の話っていうのはここの部分にかなり関係しているっていうわけ。 つまり最終的な段階ではそれを意味と結びつける。つまり、これは顔であると か机であるっていう意味と結びつける処理が行われますから、中央系のどこか と関係していくんでしょうけど、それまでの部分っていうのはかなりの信号処 理みたいなものが行われる。で、言語系の場合でも、実際に相手が何を言おう としているのか、相手の意図は何か、例えばここで僕がそろそろお腹減ったね とかいうことをいったら、まぁもうそろそろ授業やめましょうか、ということ 暗にいっているわけだよね(笑)。で、そういう推論を行うって言う部分はか なり中央系で行われているわけだよね。つまり言葉の形じゃなくて、何か相手 がメッセージを送ってくるときに、そのメッセージの意図を汲むっていうわけ になるんですよね。そういうのは完全に中央系で行われるわけですね。つまり かなりの社会的知識だとかを組み合わせないと、認識できない、と。そういう ことは言葉の上にもあって、言ったこととは全然違うことをimplyするってい うのは、いくらでもやるよね。で、おれはものすごく賢いよなぁといって、ま ともに受け取る人はほとんどいないよね。何を馬鹿なことをいってるんだ、と いう感じですよね(笑)。ま、皮肉にとることが多いんですよね。そういう複 雑な部分っていうのはほとんど中央系で行われるわけ。が、それ以前の例えば、 言葉の形に関する処理、つまりこれは文法として正しいんだ、とかそういう処 理はかなり無意識なうちにやられていて、そういう処理っていうのは周辺系で やられているってわけですね。で、結局、この中央系の処理をやるっていうの は狭義の人工知能っていうことになって、それの周辺系に属する部分、つまり 情報の提示モードに、つまり言葉であるとか視覚であるとか、聴覚であるとか に依存するような処理っていうのは人工知能から少しずつ離れていっているわ けですね。で、面白いのはそういう周辺系で行われてる処理と中央系で行われ ている処理との接点の部分が、まぁ、人工知能として面白いんだ、と。まぁ、 いいたかったのは最後の方のこの授業の言語処理っていうのとか、視覚系って いうのはどちらかというと周辺系の仕事としてどういう処理が行われているかっ ていう話をすることになると思います。それではそろそろお腹もすきましたの で、(笑)ok今日はここまで。来週からはもう少し個別のテクニカルな話をし ていきます。

おしまい


Prev

 

〔トップページへ〕 〔知能システム論の仮想講義のindexページへ〕
<vu@is.s.u-tokyo.ac.jp>

Last updated on 7 May, 1999