WEKO3
アイテム
『広島大学日本語電話会話コーパス』 : 設計と現状
https://doi.org/10.15084/00003516
https://doi.org/10.15084/000035169f39b13a-2762-4d0c-8e29-92c127d895c6
名前 / ファイル | ライセンス | アクション |
---|---|---|
papers2207.pdf (158.2 kB)
|
|
Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2022-01-21 | |||||
タイトル | ||||||
タイトル | 『広島大学日本語電話会話コーパス』 : 設計と現状 | |||||
タイトル | ||||||
タイトル | Corpus of Japanese Telephone Conversation at Hiroshima University : Design and Current Status | |||||
言語 | en | |||||
言語 | ||||||
言語 | eng | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 音声コーパス | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 日本語方言 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 自然発話 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 発話スタイル | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 社会音声学 | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Speech corpus | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Japanese dialect | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | spontaneous speech | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | speech style | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | sociophonetics | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | departmental bulletin paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00003516 | |||||
ID登録タイプ | JaLC | |||||
著者 |
五十嵐, 陽介
× 五十嵐, 陽介× 廣川, 純子× IGARASHI, Yosuke× HIROKAWA, Junko |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 研究系 言語変異研究領域 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Language Variation Division, Research Department, NINJAL | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 『広島大学日本語電話会話コーパス』(COTCO-H)は現在開発中の大規模音声データベースである。COTCO-Hは,広島大学の日本語非標準変種の母語話者である50名の学生が2つのレジスター(出身地の友人との会話,キャンパスの友人との会話)で発話した電話会話を格納している。本コーパスには,約11万語(22時間)の音声信号に加えて,その転記および品詞や活用などの形態論情報が付与されている。分節音情報付与作業は現在進行中である。COTCO-Hにはさらに補助データとして同じ話者による読み上げ音声も含まれている。COTCO-Hは,地域や発話スタイル,自発性などの違いによる言語変異に興味を持つ研究者のコミュニティに貢献するものとなるだろう。 | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | The Corpus of Japanese Telephone Conversation at Hiroshima University (COTCO-H) is a large-scale speech database that is currently under development. COTCO-H contains spontaneous telephone conversations in two different registers (conversations with a local friend and with a campus friend) produced by 50 Hiroshima University students who are native speakers of nonstandard varieties of Japanese. The corpus consists of speech signals and transcriptions for approximately 110,000 words (22 hours), along with morphological annotations such as parts of speech and conjugations. Segmental labeling is currently in progress. COTCO-H also contains different types of read speech produced by the same speakers as auxiliary data. The corpus will contribute to a community of researchers interested in variations across different regions, speech styles, and spontaneity. | |||||
出版者 | ||||||
出版者 | 国立国語研究所 | |||||
書誌情報 |
国立国語研究所論集 en : NINJAL Research Papers 号 22, p. 113-123, 発行日 2022-01 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2186-1358 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |