Item type |
会議発表論文 / Conference Paper(1) |
公開日 |
2023-12-12 |
タイトル |
|
|
タイトル |
Design and Evaluation of the Corpus of Everyday Japanese Conversation |
|
言語 |
en |
言語 |
|
|
言語 |
eng |
キーワード |
|
|
言語 |
en |
|
主題Scheme |
Other |
|
主題 |
Corpus of everyday Japanese conversation |
キーワード |
|
|
言語 |
en |
|
主題Scheme |
Other |
|
主題 |
corpus design |
キーワード |
|
|
言語 |
en |
|
主題Scheme |
Other |
|
主題 |
corpus evaluation |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者 |
Koiso, Hanae
Amatani, Haruka
Den, Yasuharu
Iseki, Yuriko
Ishimoto, Yuichi
Kashino, Wakako
Kawabata, Yoshiko
Nishikawa, Ken'ya
Tanaka, Yayoi
Usuda, Yasuyuki
Watanabe, Yuka
|
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Graduate School of Humanities, Chiba University |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
著者所属(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
National Institute for Japanese Language and Linguistics |
|
言語 |
en |
抄録(英) |
|
|
内容記述タイプ |
Abstract |
|
内容記述 |
We have constructed the Corpus of Everyday Japanese Conversation (CEJC) and published it in March 2022. The CEJC is designed to contain various kinds of everyday conversations in a balanced manner to capture their diversity. The CEJC features not only audio but also video data to facilitate precise understanding of the mechanism of real-life social behavior. The publication of a large-scale corpus of everyday conversations that includes video data is a new approach. The CEJC contains 200 hours of speech, 577 conversations, about 2.4 million words, and a total of 1675 conversants. In this paper, we present an overview of the corpus, including the recording method and devices, structure of the corpus, formats of video and audio files, transcription, and annotations. We then report some results of the evaluation of the CEJC in terms of conversant and conversation attributes. We show that the CEJC includes a good balance of adult conversants in terms of gender and age, as well as a variety of conversations in terms of conversation forms, places, activities, and numbers of conversants. |
|
言語 |
en |
書誌情報 |
en : Proceedings of the 13th Conference on Language Resources and Evaluation (LREC 2022)
p. 5587-5594,
ページ数 8,
発行日 2022
|
関連サイト |
|
|
関連タイプ |
isDerivedFrom |
|
|
識別子タイプ |
URI |
|
|
関連識別子 |
http://www.lrec-conf.org/proceedings/lrec2022/index.html |
|
|
言語 |
en |
|
|
関連名称 |
Proceedings of the 13th Language Resources and Evaluation Conference |
フォーマット |
|
|
内容記述タイプ |
Other |
|
内容記述 |
application/pdf |
|
言語 |
en |
著者版フラグ |
|
|
出版タイプ |
VoR |
|
出版タイプResource |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
出版者 |
|
|
出版者 |
European Language Resources Association |
|
言語 |
en |