WEKO3
アイテム
多重の読みを持つテキストのコーパス化
https://doi.org/10.15084/00001470
https://doi.org/10.15084/000014705afbe631-0bc3-441a-b45f-3f2cd0bab81f
名前 / ファイル | ライセンス | アクション |
---|---|---|
LRW-2016-20-P-B-9.pdf (1.6 MB)
|
|
Item type | 会議発表論文 / Conference Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2018-03-20 | |||||
タイトル | ||||||
タイトル | 多重の読みを持つテキストのコーパス化 | |||||
タイトル | ||||||
タイトル | Making corpus of Japanese text including multiple readings | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 現代日本語書き言葉均衡コーパス(BCCWJ) | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 日本語歴史コーパス(CHJ) | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Balanced Corpus of Contemporary Written Japanese (BCCWJ) | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Corpus of Historical Japanese (CHJ) | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00001470 | |||||
ID登録タイプ | JaLC | |||||
著者 |
小木曽, 智信
× 小木曽, 智信 |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 | |||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||
内容記述タイプ | Other | |||||
内容記述 | 会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 日本語のテキストには,本文漢字の通常の読みを示すのではない特殊な読みをもつ振り仮名(たとえば「強敵」と書いて「とも」とふりがなを振る類)や,掛詞(「ながめ」を「眺め」「長雨」の両用に読む類から,語形の一部から別の語を連想させる類まで),各種の洒落など,意図的に多重の読みを持たされたテキストが少なくない。従来のコーパスではこのような多重の読みは切り捨てられ,選択されたただ一つの読みを配置することが多かった。本発表では,このような多重の読みを持つテキストについて,主として『日本語歴史コーパス』の事例を整理して示すとともに,そのあるべきコーパスアノテーションの方法について論じる。 | |||||
書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 1, p. 159-162, 発行日 2017 |
|||||
関連サイト | ||||||
識別子タイプ | URI | |||||
関連識別子 | http://pj.ninjal.ac.jp/corpus_center/lrw2016.html | |||||
関連名称 | 言語資源活用ワークショップ2016 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
出版者 | ||||||
出版者 | 国立国語研究所 |