古典中国語のコーパスの研究(2022年度)
Study of Classical Chinese Corpora

班長:安岡 孝一
Coordinator: YASUOKA, Koichi

所員の研究活動>共同研究(2022年度)へ
共同研究拠点>共同研究一覧(2022年度)A,B へ
共同研究拠点>共同研究一覧(2022年度)A,B,C へ

2010年以来、われわれが構築を続けてきた古典中国語(漢文)コーパスは、MeCabを用いた形態素解析を古典中国語に適用した上で、UDPipeを用いた依存文法解析を適用するものである。これにより、単語の品詞や、単語と単語の係り受け関係を、自動で解析できるようになった。
本共同研究では、古典中国語に対する形態素解析と依存文法解析をさらに押し進め、単語より大きな単位、すなわち句や文について、それらの振る舞いや関係性を解析すべく、さらなる古典中国語解析手法を研究・開発する。

Since 2010, we have developed Classical Chinese Corpora. We first constructed the Corpora using MeCab-Kanbun, a morphological analyzer for Classical Chinese texts. Then we applied UD-Kanbun, a dependency parser based on Universal Dependencies, into the Corpora. Using the Corpora, now we can analyze Classical Chinese texts in word-level: word segmentation (tokenization), Part-Of-Speech tagging, and dependency parsing.
In this study, we will investigate to analyze Classical Chinese texts in phrase- and sentence-levels, enhancing the Classical Chinese Corpora.

研究期間:2020年4月~2023年3月

班員(所内)

氏名 所属
安岡 孝一
池田 巧
Christian Wittern
守岡 知彦
白須 裕之

2021年05月31日 更新