WEKO3
アイテム
発話文への発話者情報付与の基本設計 : 『現代日本語書き言葉均衡コーパス』収録の小説を対象に
https://doi.org/10.15084/00001456
https://doi.org/10.15084/00001456931252de-25fa-4292-bfb9-d983d0985c23
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
| Item type | 会議発表論文 / Conference Paper(1) | |||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2018-03-20 | |||||||||||||||||
| タイトル | ||||||||||||||||||
| タイトル | 発話文への発話者情報付与の基本設計 : 『現代日本語書き言葉均衡コーパス』収録の小説を対象に | |||||||||||||||||
| タイトル | ||||||||||||||||||
| タイトル | Fundamental Planning of Annotation of Speaker's Information to Utterances : Focused on Novels in “Balanced Corpus of Contemporary Written Japanese” | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 言語 | ||||||||||||||||||
| 言語 | jpn | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | 現代日本語書き言葉均衡コーパス(BCCWJ) | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 言語 | en | |||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | Balanced Corpus of Contemporary Written Japanese (BCCWJ) | |||||||||||||||||
| 資源タイプ | ||||||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||||
| 資源タイプ | conference paper | |||||||||||||||||
| ID登録 | ||||||||||||||||||
| ID登録 | 10.15084/00001456 | |||||||||||||||||
| ID登録タイプ | JaLC | |||||||||||||||||
| 著者 |
宮嵜, 由美
× 宮嵜, 由美× 柏野, 和佳子
WEKO
4470
× 山崎, 誠
WEKO
4471
|
|||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | 国立国語研究所 | |||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | 国立国語研究所 | |||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | 国立国語研究所 | |||||||||||||||||
| 会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | 会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター | |||||||||||||||||
| 抄録 | ||||||||||||||||||
| 内容記述タイプ | Abstract | |||||||||||||||||
| 内容記述 | 現在,国立国語研究所音声言語研究領域では,『日本語日常会話コーパス』(以下,CEJC)の開発が行われている。多様な話し言葉の会話行動の収録を目指す上記プロジェクトの理念と同様,本プロジェクトの目指す,書き言葉における会話場面の「発話」への発話者情報付与も重要な“日本語の会話”の一端を担うものである。すでに公開されている『現代日本語書き言葉均衡コーパス』(以下,BCCWJ)の約6割を占める書籍のサンプルには,会話場面における大量の発話文が存在する。発話文は地の文とは言語的に異なる特徴を持つことが多いため,分析に当たっては別に扱うことが妥当であるが,現在の検索環境では難しい。そこで,本稿では,BCCWJ収録の小説を対象に,小説特有ともいえる発話部分特定の問題点(かぎ括弧で括られない例や非現実場面での発話など)を提示する。機械抽出のみでは同定の難しい発話箇所と発話者情報付与について,その基本設計の「発話認定箇所」基準を中心に提案する。 | |||||||||||||||||
| 書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 1, p. 38-48, 発行日 2017 |
|||||||||||||||||
| 関連サイト | ||||||||||||||||||
| 識別子タイプ | URI | |||||||||||||||||
| 関連識別子 | http://pj.ninjal.ac.jp/corpus_center/lrw2016.html | |||||||||||||||||
| 関連名称 | 言語資源活用ワークショップ2016 | |||||||||||||||||
| フォーマット | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | application/pdf | |||||||||||||||||
| 著者版フラグ | ||||||||||||||||||
| 出版タイプ | VoR | |||||||||||||||||
| 出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||
| 出版者 | ||||||||||||||||||
| 出版者 | 国立国語研究所 | |||||||||||||||||