WEKO3
アイテム
『日本語日常会話コーパス』モニター公開版の構築
https://repository.ninjal.ac.jp/records/3071
https://repository.ninjal.ac.jp/records/3071694e595f-3a6d-4385-bcf3-04e616ff0058
名前 / ファイル | ライセンス | アクション |
---|---|---|
krkgg_32_2_133.pdf (1.2 MB)
|
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2020-10-30 | |||||
タイトル | ||||||
タイトル | 『日本語日常会話コーパス』モニター公開版の構築 | |||||
タイトル | ||||||
タイトル | Compilation of the Monitor Version of\nthe Corpus of Everyday Japanese Conversation | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 会話コーパス | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | コーパス設計 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | アノテーション | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | conversation corpus | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | corpus design | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | annotation | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | journal article | |||||
著者 |
小磯, 花絵
× 小磯, 花絵× Koiso, Hanae |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | National Institute for Japanese Language and Linguistics | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,『日本語日常会話コーパス』(CEJC)の構築を進めている.CEJC は,自宅での家族との会話や飲食店での友人との会話,職場での同僚との会合,散策時の会話など,日常生活における多様な場面の会話を,映像まで含めて収録・公開するものであり,世界的に見ても極めて新しい試みである.最終的には200時間規模のコーパスとして2021年度末に公開する予定であるが,コーパスの利用可能性や問題などを把握し今後の構築に活かすために,50 時間のデータについて2018 年12 月にモニター公開を開始した.本稿ではCEJC モニター公開版の設計・構成やそれを用いた研究の可能性について概説する. | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | We have been constructing the Corpus of Everyday Japanese Conversation, CEJC, under the NINJAL collaborative research project since 2016. The main features of the CEJC are i) that we target conversations embedded in naturally occurring ctivities in daily life; ii) that we collect various kinds of everyday conversations in a balanced manner so as to capture the diversity of everyday conversations and to observe natural conversational behavior; and iii) that we collect and publish not only audio but also video data in order to precisely understand the mechanism of our real-life social behavior. Prior to the publication of the whole corpus scheduled for 2022, we published the monitor version of the CEJC in December 2018. In this article, we first outline the design of the monitor version of the CEJC. Then, we conduct a preliminary analysis, showing possible implications of the corpus. | |||||
出版者 | ||||||
出版者 | 計量国語学会 | |||||
書誌情報 |
計量国語学 en : Mathematical Linguistics 巻 32, 号 2, p. 133-142, 発行日 2019-06 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 0453-4611 | |||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2433-0302 | |||||
DOI | ||||||
関連タイプ | isIdenticalTo | |||||
識別子タイプ | DOI | |||||
関連識別子 | 10.24701/mathling.32.2_133 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |