本文へジャンプ

1構造的手法から始まった言語処理

「壁にぶつかった構造的手法」

ありのままの言葉はあいまいで、揺れたり、捩じれたりしている。人はそれを、無意識のうちに知識を使って受け取っているのだ。

言語学の理論を元にした自然言語処理のアプローチが迷路に入りこんでしまったのは、なぜだったんでしょうか?

それは、実際に使われているありのままの言語を理論からの規則だけで扱おうとしたから。言語を構造的な文法の理論でとらえるということは、抽象化された理想の言語を想定して、それに基づいた言語の規則(文法)をつくるということなんです。でも、実際に使われている日常の言語は、地域や年代、使われる場面で大きく違ってきます。そういう揺らぎは、挙げるときりがありません。さらに文法自体にも、実はあいまいなところがあります。

文脈や受け取る人によって、意味が何通りにもとれる文の話は聞いたことがあるでしょう? たとえば「プールで泳いでいる彼を見た」は、文法的には2通りの解釈が可能です。たいがいは、「彼が泳いでいる」場所がプールだと考えますよね。見た人がプールにいて、「彼」はプール以外の場所(たとえば海)で泳いでいたという解釈も可能ですが、普通はそうは考えません。

図:プールにいたのは誰? 意味を2通りにとれる文の例

僕らは言葉を受け取るとき、無意識のうちに知識を使って多くの可能性のなかから1つの解釈を選び取り、理解しているのです。だけど、言語学の文法からいえるのは複数の解釈があるということだけ。実世界に関する常識なしに、システムを作ることはできません。

言語の理論からのアプローチに足りなかったのは、人の知識ですか?

そう、知識や常識。もうすこし広くて抽象的な言い方をすると、文法でとらえられる言葉を実世界の言葉に滑らかにつなぐような技術です。

人間の言語には、骨の部分と肉の部分があるんです。骨というのは言語の構造で、文法的な規則の部分。理想的な言語が従う規則。この規則に沿っていないと、文とはいえない単語の羅列になり、コミュニケーションがとれなくなったりします。でも実際には、意味とか文脈とかいうぶよぶよしたものが言語の骨にまとわりついて、人間のコミュニケーションが成り立っているんですね。

僕はずっと、この2つをなめらかに結び付けること―言語の理論の部分とありのままの言葉の使われ方とを結ぶ研究をやってきたわけです。

ページトップへ戻る