@inproceedings{oai:repository.ninjal.ac.jp:00001530, author = {大村, 舞 and OMURA, Mai and 浅原, 正幸 and ASAHARA, Masayuki}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター, 自然言語処理の分野では多言語かつ言語横断的な言語研究が盛んに取り組まれている。その言語横断的な言語研究の取り組みとしてUniversal Dependencies(UD)がある。UDでは品詞や係り受け構造の標準・スキーマを定め,多言語のコーパスを提供している。本論文では,日本語コーパスである現代日本語書き言葉均衡コーパス(BCCWJ)をUDのスキーマへと変換したコーパスについて紹介をする。BCCWJでは日本語における文節単位の係り受け情報がすでに付与されている。この係り受け構造を基にしてUDへと変換するプログラムの開発を行った。しかし,文節単位はUDの単語単位には沿っていない。そのため,BCCWJで提供されている短単位と長単位というふたつの言語単位を単語の単位をして認定したコーパスを構築する。短単位と長単位についてUDのスキーマに当てはめた場合,どのような係り受け構造ができるのかを示す。, application/pdf, 国立国語研究所, 国立国語研究所}, pages = {133--143}, publisher = {国立国語研究所}, title = {現代日本語書き言葉均衡コーパスのUniversal Dependencies}, volume = {2}, year = {2017}, yomi = {オオムラ, マイ and アサハラ, マサユキ} }