東アジア古典文献 コーパスの研究(2010年度)

班長 安岡 孝一

東アジア古典文献 コーパスの研究
漢文テキストの文法解析

わが国の文化的活動は、奈良時代より随時もたらされた大量の中国の漢文と、それを訓読という手法によって解釈した歴史なしには語ることができない。特に、近世、明治~昭和初期における漢文訓読という営為は、伝統的な日本の思想基盤を見直す作業であったとともに、近代国家としての思想基盤を再構築する過程において、重要な位置を占めるものであった。

本共同研究の構想は、その前身となった共同研究班「漢字情報学の構築」(2004年4月~2008年3月、班長:安岡孝一)で培われた知識、特に、コンピュータを用いた漢文解析に関る研究の中から生まれた。その中で、われわれは、日本における訓読が、元となる漢文とその読み下し文との間でそれぞれ異なる文法構造を橋渡しするための手法であることから、漢文の文法解析において有効に働きうるはずだ、という感触を得た。すなわち、訓読という手法を情報学的な視点から再検討し、訓読漢文コーパスともいうべきものを作成して、それを他の一般的な漢文(白文)に適用することで、漢文の意味構造を解析可能になるだろう、という予想である。

本共同研究では、明治~昭和初期に日本国内で作成された訓読漢文テキストをコーパス化し、それを基に、漢文の意味構造を解析するシステムの研究・開発をおこなっている。すなわち、これまで漢文を読むための技法に過ぎなかった訓読を、コンピュータによる文法解析メソッドの一つとして、情報学的視点から捉えなおしている。この結果、文法的な構造化がおこなわれずに単なる文字列のままで放置されている大量の漢文に対して、その意味構造を解析することが可能となり、漢文の内容理解への大きな足がかりになると考えられる。


所内班員
池田 巧、C.Wittern、守岡知彦