WEKO3
アイテム
『日本語歴史コーパス』短単位アノテーション作業効率化に向けた形態素解析用辞書『UniDic』の段階的特殊化の検討 : 近松コーパスを例として
https://doi.org/10.15084/00001476
https://doi.org/10.15084/0000147640278428-270d-4d9a-960a-6dd3576a1f45
名前 / ファイル | ライセンス | アクション |
---|---|---|
LRW-2016-26-O-C-2.pdf (396.6 kB)
|
|
Item type | 会議発表論文 / Conference Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2018-03-20 | |||||
タイトル | ||||||
タイトル | 『日本語歴史コーパス』短単位アノテーション作業効率化に向けた形態素解析用辞書『UniDic』の段階的特殊化の検討 : 近松コーパスを例として | |||||
タイトル | ||||||
タイトル | An Examination of Stepwise Specialization of Morphological Analysis Dictionary “UniDic” for Efficient Word Annotation on “Corpus of Historical Japanese” : The Case of Chikamatsu Corpus | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | UniDic | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 日本語歴史コーパス(CHJ) | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | UniDic | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Corpus of Historical Japanese (CHJ) | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00001476 | |||||
ID登録タイプ | JaLC | |||||
著者 |
岡, 照晃
× 岡, 照晃× OKA, Teruaki |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 | |||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||
内容記述タイプ | Other | |||||
内容記述 | 会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 本論文では,現在,国語研の通時コーパス構築プロジェクトで整備中の近世前期の上方資料である『近松門左衛門世話物浄瑠璃』への短単位形態論情報アノテーションの効率化を目的に,形態素解析器MeCab の追加学習機能を使い,既存の『洒落本』用の短単位解析用辞書から段階的に,近松専用短単位解析用辞書を作成する方法について述べる.具体的には,まず比較的時代の近い洒落本解析用辞書を,上方の洒落本コーパスのみで上方の洒落本解析用辞書にアダプテーションする.次に作成した上方の洒落本解析用辞書を,同じく上方の資料である近松コーパスで近松資料解析用辞書にさらにアダプテーションする.本手法により,従来手法よりも高い精度(語彙素認定F1 値,地の文:86.85 → 89.60,会話文:85.07 → 88.82)で,近松資料を解析できることを確認した.また本論文で作成した短単位解析用辞書を使った近松資料のコーパス化作業が現在,進行中である. | |||||
書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 1, p. 214-225, 発行日 2017 |
|||||
関連サイト | ||||||
識別子タイプ | URI | |||||
関連識別子 | http://pj.ninjal.ac.jp/corpus_center/lrw2016.html | |||||
関連名称 | 言語資源活用ワークショップ2016 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
出版者 | ||||||
出版者 | 国立国語研究所 |