WEKO3
アイテム
BCCWJ小説会話文への話者情報の付与とその活用
https://doi.org/10.15084/00002582
https://doi.org/10.15084/00002582edec1436-05aa-4be1-b8f8-b572f7989cb0
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
| Item type | 会議発表論文 / Conference Paper(1) | |||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2020-02-06 | |||||||||||||||||
| タイトル | ||||||||||||||||||
| タイトル | BCCWJ小説会話文への話者情報の付与とその活用 | |||||||||||||||||
| タイトル | ||||||||||||||||||
| タイトル | Annotation and Utilization of Speaker Information to Conversational Sentences in Novels Samples of BCCWJ | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 言語 | ||||||||||||||||||
| 言語 | jpn | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | 現代日本語書き言葉均衡コーパス(BCCWJ) | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 言語 | en | |||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | Balanced Corpus of Contemporary Written Japanese (BCCWJ) | |||||||||||||||||
| 資源タイプ | ||||||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||||
| 資源タイプ | conference paper | |||||||||||||||||
| ID登録 | ||||||||||||||||||
| ID登録 | 10.15084/00002582 | |||||||||||||||||
| ID登録タイプ | JaLC | |||||||||||||||||
| 著者 |
山崎, 誠
× 山崎, 誠
WEKO
4471
× 柏野, 和佳子
WEKO
4470
× 宮嵜, 由美 |
|||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | 国立国語研究所 | |||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | 国立国語研究所 | |||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | 明治大学 | |||||||||||||||||
| 著者所属(英) | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | National Institute for Japanese Language and Linguistics | |||||||||||||||||
| 著者所属(英) | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | National Institute for Japanese Language and Linguistics | |||||||||||||||||
| 著者所属(英) | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | Meiji University | |||||||||||||||||
| 会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | 会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター | |||||||||||||||||
| 抄録 | ||||||||||||||||||
| 内容記述タイプ | Abstract | |||||||||||||||||
| 内容記述 | 本稿では「現代日本語書き言葉均衡コーパス」の図書館サブコーパスに含まれる小説(NDCで913, 923など)のサンプルにおける会話文に話者情報を付与した結果とそれを用いた分析について紹介する。付与したサンプル数は2,663サンプルである。付与した話者情報は「話者名、性別、年齢層」(これらは必須)のほか、「話者の社会的属性(職業など)、会話相手の情報、会話モード(電話での会話、方言での会話、外国人の会話等)」なども全てのサンプルにではないが付けている。「話者名、性別、年齢層」については、「中納言」の検索結果に表示することを計画している。また、その他の話者情報は、中納言のサイトからBCCWJ所有者に限りダウンロードできるようにする予定である。分析から分かったこととして以下の4点を挙げる。(1)小説の全センテンスの約4割が会話文であること。(2)性別では女性の会話文が全体の約3割であること。(3)年齢層では約75%が成年層の会話であり,若年層は約20%,老年層は約5%であること。(4)会話モードでは、電話による会話が全体の約4%程度あること。また、方言による会話文が約5,000あり、その多くは大阪を中心とした関西の方言であること。 | |||||||||||||||||
| 書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 4, p. 313-320, 発行日 2019 |
|||||||||||||||||
| 関連サイト | ||||||||||||||||||
| 識別子タイプ | URI | |||||||||||||||||
| 関連識別子 | https://pj.ninjal.ac.jp/corpus_center/lrw2019.html | |||||||||||||||||
| 関連名称 | 言語資源活用ワークショップ2019 | |||||||||||||||||
| フォーマット | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | application/pdf | |||||||||||||||||
| 著者版フラグ | ||||||||||||||||||
| 出版タイプ | VoR | |||||||||||||||||
| 出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||
| 出版者 | ||||||||||||||||||
| 出版者 | 国立国語研究所 | |||||||||||||||||