班長:安岡 孝一
Coordinator: YASUOKA, Koichi
2010年以来、われわれが構築を続けてきた古典中国語(漢文)コーパスは、Conditional Random Fields を用いた形態素解析を古典中国語に適用した上で、Universal Dependencies にもとづく依存文法解析を適用するものである。これにより、古典中国語における単語と単語の係り受け関係を、自動で解析できるようになった。
本共同研究では、古典中国語に対する形態素解析と依存文法解析を応用して、現代中国語や近代日本語・韓国語・タイ語などの周辺諸言語に対し、文法解析手法を研究・開発する。
Since 2010, we have been developing Classical Chinese Corpora. We first constructed the Corpora using MeCab-Kanbun, a morphological analyzer based on Conditional Random Fields, for Classical Chinese texts. Then we applied SuPar-Kanbun, a dependency parser based on Universal Dependencies, to the Corpora. Using the Corpora and pre-trained language models, we can now analyze Classical Chinese texts by Part-Of-Speech tagging and dependency-parsing.
In this study, we will enhance our method so that it can be applied to other languages, such as Mandarin Chinese, Thai, Japanese, and Korean.
研究期間:2023年4月~2026年3月
氏名 Name | 所属 Affiliation |
鈴木 慎吾 SUZUKI, Shingo |
大阪大学 言語文化研究科 OSAKA University |
山崎 直樹 YAMAZAKI, Naoki |
関西大学 外国語学部 KANSAI University |
二階堂 善弘 NIKAIDO, Yoshihiro |
関西大学 文学部 KANSAI University |
師 茂樹 MORO, Shigeki |
花園大学 文学部 HANAZONO University |
守岡 知彦 MORIOKA, Tomohiko |
国文学研究資料館 研究部 National Institute of Japanese Literature |
2023年07月03日 更新
氏名 Name | 所属 Affiliation |
安岡 孝一 YASUOKA, Koichi |
[班長 Coordinator] |
池田 巧 IKEDA, Takumi |
|
ウィッテルン,クリスティアン WITTERN, Christian |
2023年07月03日 更新