@inproceedings{oai:repository.ninjal.ac.jp:00001492, author = {岡, 照晃 and OKA, Teruaki}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター, 本論文では,現在,国語研の通時コーパス構築プロジェクトで整備中の近世前期の上方資料である『近松門左衛門世話物浄瑠璃』への短単位形態論情報アノテーションの効率化を目的に,形態素解析器MeCab の追加学習機能を使い,既存の『洒落本』用の短単位解析用辞書から段階的に,近松専用短単位解析用辞書を作成する方法について述べる.具体的には,まず比較的時代の近い洒落本解析用辞書を,上方の洒落本コーパスのみで上方の洒落本解析用辞書にアダプテーションする.次に作成した上方の洒落本解析用辞書を,同じく上方の資料である近松コーパスで近松資料解析用辞書にさらにアダプテーションする.本手法により,従来手法よりも高い精度(語彙素認定F1 値,地の文:86.85 → 89.60,会話文:85.07 → 88.82)で,近松資料を解析できることを確認した.また本論文で作成した短単位解析用辞書を使った近松資料のコーパス化作業が現在,進行中である., application/pdf, 国立国語研究所}, pages = {214--225}, publisher = {国立国語研究所}, title = {『日本語歴史コーパス』短単位アノテーション作業効率化に向けた形態素解析用辞書『UniDic』の段階的特殊化の検討 : 近松コーパスを例として}, volume = {1}, year = {2017}, yomi = {オカ, テルアキ} }