@article{oai:repository.ninjal.ac.jp:00000746, author = {伝, 康晴 and DEN, Yasuharu}, issue = {2}, journal = {国語研プロジェクトレビュー, NINJAL Project Review}, month = {Oct}, note = {千葉大学文学部, 話し言葉コーパスでは,音声収録・転記といった開発初期の負担が大きく,とくに会話に関しては大規模なコーパスは皆無である。国語研プロジェクト「多様な様式を網羅した会話コーパスの共有化」では,既存の会話コーパスの共有化というアプローチに着目し,コーパスに記述する基本情報を共通化し,共有するための方法論の構築を目指している。その手初めとして,プロジェクト内の会話コーパスの転記方式の違いを調査し,主要な転記方式である『日本語話し言葉コーパス』方式と会話分析方式の間の自動変換を試みた。変換精度はある程度高いものの,さらなる精度向上が必要な部分もあった。, Developing spoken language corpora is difficult because of the tremendous effort required for recording and transcription, and this has hindered the construction of large-scale spoken language corpora. Our project aims at developing a methodology for sharing existing conversation corpora that cover diverse styles and settings. As a first step in this endeavor, we examined the different transcription conventions for corpora that have been developed by various researchers, and then attempted automatic conversion between CSJ-style and CA-style transcriptions. The accuracy of our method was quite high, although there is still room for improvement., application/pdf}, pages = {89--99}, title = {〈共同研究プロジェクト紹介〉独創・発展型 : 多様な様式を網羅した会話コーパスの共有化 会話コーパスの共有化に向けて : 転記方式の自動変換}, volume = {4}, year = {2013}, yomi = {デン, ヤスハル} }