@inproceedings{oai:repository.ninjal.ac.jp:00001705, author = {佐々木, 稔 and SASAKI, Minoru and 古宮, 嘉那子 and KOMIYA, Kanako and 新納, 浩幸 and SHINNOU, Hiroyuki}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター, 自然言語処理では,コーパス中の単語に対して意味的な特徴をベクトルで表現し,様々な自然言語処理タスクにおいて利用することが多い.単語をベクトルで表現することにより,単語間の類似度を計算し,単語や文の違いなどの比較が可能である.これまでの研究では,単語ベクトルを生成するためには,ひとつの大規模な文書データから生成する必要があった.そのため,書籍・新聞・雑誌など,文書の分野による分散表現の比較や特徴分析は行われていなかった.すなわち,分野による単語の類似性や違いは明らかになっていない.そこで,本研究では領域ごとの単語ベクトル生成手法を提案し,各領域における単語の特徴分析を行う.書籍・雑誌・新聞の3つの分野(領域)の日本語のコーパスに対し,指定した対象単語に対して単語ベクトルを作成する.対象単語のベクトルを用いて,対象単語が類似する単語を各領域において抽出し,単語の使用傾向などの分析を行う.実験の結果,同一単語であっても他領域で使われる意味と異なった語義で使用されている単語があることが分かった.加えて,動詞は領域からの依存度が低い,副詞は領域への依存度が高いなど品詞によって領域の依存度が異なるといった傾向があった.また,書籍領域では様々な種類の語句,新聞領域では政治関連語句,雑誌領域においてはカタカナ語が多く登場するなど,類似した単語には領域によって特徴がみられた., application/pdf, 茨城大学, 茨城大学, 茨城大学, Ibaraki University, Ibaraki University, Ibaraki University}, pages = {553--560}, publisher = {国立国語研究所}, title = {単語の分散表現を用いた領域における出現単語の特徴分析}, volume = {3}, year = {2018}, yomi = {ササキ, ミノル and コミヤ, カナコ and シンノウ, ヒロユキ} }