WEKO3
アイテム
UD Japanese-BCCWJの構築と分析
https://doi.org/10.15084/00001650
https://doi.org/10.15084/00001650c4c446f3-1c9f-43dd-b292-2a803c29a035
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
| Item type | 会議発表論文 / Conference Paper(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2019-02-14 | |||||||||||
| タイトル | ||||||||||||
| タイトル | UD Japanese-BCCWJの構築と分析 | |||||||||||
| タイトル | ||||||||||||
| タイトル | Construction and Analysis of UD Japanese-BCCWJ | |||||||||||
| 言語 | en | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | 現代日本語書き言葉均衡コーパス(BCCWJ) | |||||||||||
| キーワード | ||||||||||||
| 言語 | en | |||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | Balanced Corpus of Contemporary Written Japanese (BCCWJ) | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
| 資源タイプ | conference paper | |||||||||||
| ID登録 | ||||||||||||
| ID登録 | 10.15084/00001650 | |||||||||||
| ID登録タイプ | JaLC | |||||||||||
| 著者 |
大村, 舞
× 大村, 舞× 浅原, 正幸
WEKO
4506
|
|||||||||||
| 著者所属 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 国立国語研究所 | |||||||||||
| 著者所属 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 国立国語研究所 | |||||||||||
| 著者所属(英) | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | National Institute for Japanese Language and Linguistics | |||||||||||
| 著者所属(英) | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | National Institute for Japanese Language and Linguistics | |||||||||||
| 会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター | |||||||||||
| 抄録 | ||||||||||||
| 内容記述タイプ | Abstract | |||||||||||
| 内容記述 | 自然言語処理の分野では多言語かつ言語横断的な言語研究が盛んに取り組まれている。その言語横断的な言語研究の取り組みとしてUniversal Dependencies(UD)がある。本論文では、日本語のコーパスであるUD Japanese-BCCWJについて紹介をする。UD Japanese-BCCWJは現代日本語書き言葉均衡コーパス(BCCWJ)に付随する係り受け情報などを組み合わせて、UDへと変換、構築したBCCWJのUniversal Dependencieである。これは日本語のUDの中でも1980文章、57,256文、約126万単語を含む最大規模また複数のレジスターを内包したデータセットである。UD Japanese-BCCWJの特徴について説明する。またUD Japanese-BCCWJの構築手順について説明し、現状における問題点について議論する。 | |||||||||||
| 書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 3, p. 161-175, 発行日 2018 |
|||||||||||
| 関連サイト | ||||||||||||
| 識別子タイプ | URI | |||||||||||
| 関連識別子 | https://pj.ninjal.ac.jp/corpus_center/lrw2018.html | |||||||||||
| 関連名称 | 言語資源活用ワークショップ2018 | |||||||||||
| フォーマット | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | application/pdf | |||||||||||
| 著者版フラグ | ||||||||||||
| 出版タイプ | VoR | |||||||||||
| 出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||
| 出版者 | ||||||||||||
| 出版者 | 国立国語研究所 | |||||||||||