班長:安岡 孝一
Coordinator: YASUOKA, Koichi
所員の研究活動>共同研究(2022年度)へ
共同研究拠点>共同研究一覧(2022年度)A,B へ
共同研究拠点>共同研究一覧(2022年度)A,B,C へ
2010年以来、われわれが構築を続けてきた古典中国語(漢文)コーパスは、MeCabを用いた形態素解析を古典中国語に適用した上で、UDPipeを用いた依存文法解析を適用するものである。これにより、単語の品詞や、単語と単語の係り受け関係を、自動で解析できるようになった。
本共同研究では、古典中国語に対する形態素解析と依存文法解析をさらに押し進め、単語より大きな単位、すなわち句や文について、それらの振る舞いや関係性を解析すべく、さらなる古典中国語解析手法を研究・開発する。
Since 2010, we have developed Classical Chinese Corpora. We first constructed the Corpora using MeCab-Kanbun, a morphological analyzer for Classical Chinese texts. Then we applied UD-Kanbun, a dependency parser based on Universal Dependencies, into the Corpora. Using the Corpora, now we can analyze Classical Chinese texts in word-level: word segmentation (tokenization), Part-Of-Speech tagging, and dependency parsing.
In this study, we will investigate to analyze Classical Chinese texts in phrase- and sentence-levels, enhancing the Classical Chinese Corpora.
研究期間:2020年4月~2023年3月
氏名 | 所属 |
安岡 孝一 | |
池田 巧 | |
Christian Wittern | |
守岡 知彦 | |
白須 裕之 |
2021年05月31日 更新