@inproceedings{oai:repository.ninjal.ac.jp:00001659, author = {田邊, 絢 and 古宮, 嘉那子 and KOMIYA, Kanako and 浅原, 正幸 and ASAHARA, Masayuki and 佐々木, 稔 and SASAKI, Minoru and 新納, 浩幸 and SHINNOU, Hiroyuki and TANABE, Aya}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター, 日本語歴史コーパス中の単語には、現代語と同様の意味で扱われている単語と、古語特有の意味を持つ単語がある。本研究では、この現代語にはない古語特有の単語の語義(言葉の意味)を未知語義と定義して、日本語歴史コーパス中から、未知語義を検出するシステムの提案を行う。具体的には、日本語歴史コーパス中の単語を、(1)現代の分類語彙表でその単語の分類番号として登録されている語義をもつ語、(2)現代の分類語彙表にある語義をもつが、現在その語義は、その言葉の語義として分類語彙表は登録されていない語、(3)その語義の定義が現代の分類語彙表にないため、分類番号が振られていない語、の3種類にクラス分けする。実験では、各単語について、出現書字形や見出しなどの8要素を基本素性として用いた。また、別の日本語歴史コーパスからword2vecを用いて、3種類の単語の分散表現のベクトル(50次元、100次元、200次元)を作成し、素性として加えた。それぞれSVMを用いて正解率を比較したところ、日本語歴史コーパス中の未知語義の検出において、単語の分散表現のベクトルが正解率を向上させることが分かった。, application/pdf, 茨城大学, 茨城大学, 国立国語研究所, 茨城大学, 茨城大学, Ibaraki University, Ibaraki University, National Institute for Japanese Language and Linguistics, Ibaraki University, Ibaraki University}, pages = {112--117}, publisher = {国立国語研究所}, title = {日本語歴史コーパスの現代語辞書における未知語義判定システム}, volume = {3}, year = {2018}, yomi = {タナベ, アヤ and コミヤ, カナコ and アサハラ, マサユキ and ササキ, ミノル and シンノウ, ヒロユキ} }