古典中国語のコーパスの研究（2022年度）Study of Classical Chinese Corpora

古典中国語のコーパスの研究（2022年度）
Study of Classical Chinese Corpora

班長：安岡　孝一
Coordinator: YASUOKA, Koichi

所員の研究活動＞共同研究（2022年度）へ
 共同研究拠点＞共同研究一覧（2022年度）A,B へ
 共同研究拠点＞共同研究一覧（2022年度）A,B,C へ

2010年以来、われわれが構築を続けてきた古典中国語(漢文)コーパスは、MeCabを用いた形態素解析を古典中国語に適用した上で、UDPipeを用いた依存文法解析を適用するものである。これにより、単語の品詞や、単語と単語の係り受け関係を、自動で解析できるようになった。
本共同研究では、古典中国語に対する形態素解析と依存文法解析をさらに押し進め、単語より大きな単位、すなわち句や文について、それらの振る舞いや関係性を解析すべく、さらなる古典中国語解析手法を研究・開発する。

Since 2010, we have developed Classical Chinese Corpora. We first constructed the Corpora using MeCab-Kanbun, a morphological analyzer for Classical Chinese texts. Then we applied UD-Kanbun, a dependency parser based on Universal Dependencies, into the Corpora. Using the Corpora, now we can analyze Classical Chinese texts in word-level: word segmentation (tokenization), Part-Of-Speech tagging, and dependency parsing.
In this study, we will investigate to analyze Classical Chinese texts in phrase- and sentence-levels, enhancing the Classical Chinese Corpora.

研究期間：2020年4月～2023年3月

班員（所内）

氏名	所属
安岡　孝一
池田　巧
Christian Wittern
守岡　知彦
白須　裕之

2021年05月31日更新

京都大学人文科学研究所

古典中国語のコーパスの研究（2022年度）
Study of Classical Chinese Corpora

班員（所内）

共同研究拠点

共同利用拠点