WEKO3
アイテム
『昭和話し言葉コーパス』の設計と構築
https://doi.org/10.15084/00003522
https://doi.org/10.15084/00003522aa413b4a-b22b-4475-b0d0-c1d2f17bd865
名前 / ファイル | ライセンス | アクション |
---|---|---|
papers2212.pdf (1.3 MB)
|
|
Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2022-01-21 | |||||
タイトル | ||||||
タイトル | 『昭和話し言葉コーパス』の設計と構築 | |||||
タイトル | ||||||
タイトル | Design and Construction of the Showa Speech Corpus | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 『昭和話し言葉コーパス』(SSC) | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 『談話語の実態』 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | アノテーション | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 話し言葉の経年変化 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 通時音声コーパス | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Showa Speech Corpus (SSC) | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Research in the Colloquial Japanese | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | annotation | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | diachronic change of spoken language | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | diachronic speech corpus | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | departmental bulletin paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00003522 | |||||
ID登録タイプ | JaLC | |||||
著者 |
丸山, 岳彦
× 丸山, 岳彦× 小磯, 花絵× 西川, 賢哉× MARUYAMA, Takehiko× KOISO, Hanae× NISHIKAWA, Ken'ya |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 専修大学 / 国立国語研究所 研究系 音声言語研究領域 客員教授 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 研究系 音声言語研究領域 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 研究系 音声言語研究領域 | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Senshu University / Invited Professor, Spoken Language Division, Research Department, NINJAL | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Spoken Language Division, Research Department, NINJAL | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Spoken Language Division, Research Department, NINJAL | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 国立国語研究所基幹研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,2016年度より『昭和話し言葉コーパス』(SSC: Showa Speech Corpus)の構築を進めてきた。2021年3月にその構築作業が完了し,コーパス検索アプリケーション「中納言」で一般公開を開始した。『昭和話し言葉コーパス』は,1950年代から1970年代にかけて国立国語研究所で作成された録音資料群を再編成し,現代の技術で話し言葉コーパスとして整備したものである。過去の音源を現代の技術でコーパス化したという点において,日本語では従来存在しなかったタイプのコーパスであると言える。また,現代の話し言葉コーパスと連結し,比較・対照することによって,話し言葉の経年変化を探るための「通時音声コーパス」として利用できる点で,画期的である。本稿では,今回構築した『昭和話し言葉コーパス』について,そこに収録されている録音資料群の出自や当時の国立国語研究所の状況,コーパス構築の過程とアノテーション,さらに予備的な分析結果について述べる。 | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Construction of the "Showa Speech Corpus" (SSC) began in 2016, and was completed in March 2021 and made available to the public online through the corpus search application Chunagon. The SSC consists of a collection of recordings made from the 1950s to the 1970s by the National Institute for Japanese Language and Linguistics. Thus, it is a speech corpus made with modern technology, but with old recordings as its content. The SSC is innovative in that it can be used to explore the changes in spoken language over time (i.e., as a "diachronic speech corpus") by linking, comparing, and contrasting the SSC with modern spoken language corpora such as the Corpus of Spontaneous Japanese (CSJ) and the Corpus of Everyday Japanese Conversation (CEJC). In this paper, we describe the origins of the recorded materials stored in the SSC, the process of corpus construction and annotation, and the results of the preliminary analysis. | |||||
出版者 | ||||||
出版者 | 国立国語研究所 | |||||
書誌情報 |
国立国語研究所論集 en : NINJAL Research Papers 号 22, p. 197-221, 発行日 2022-01 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2186-1358 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |