WEKO3
アイテム
概念辞書の類義語と分散表現を利用した教師なし all-words WSD
https://repository.ninjal.ac.jp/records/2255
https://repository.ninjal.ac.jp/records/2255e82c81bf-2441-4091-bd72-252bdbe83247
名前 / ファイル | ライセンス | アクション |
---|---|---|
jnlp_26_361.pdf (807.1 kB)
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2019-10-17 | |||||
タイトル | ||||||
タイトル | 概念辞書の類義語と分散表現を利用した教師なし all-words WSD | |||||
タイトル | ||||||
タイトル | Unsupervised All-words WSD Using Synonyms and Embeddings | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | all-words | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 語義曖昧性解消 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 分類語彙表 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 分散表現 | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | All-words | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Word Sense Disambiguation | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Word List by Semantic Principles | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | journal article | |||||
著者 |
鈴木, 類
× 鈴木, 類× 古宮, 嘉那子× 浅原, 正幸× 佐々木, 稔× 新納, 浩幸× Suzuki, Rui× Komiya, Kanako× Asahara, Masayuki× Sasaki, Minoru× Shinnou, Hiroyuki |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 茨城大学 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 茨城大学 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 茨城大学 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 茨城大学 | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Ibaraki University | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Ibaraki University | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | National Institute for Japanese Language and Linguistics | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Ibaraki University | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Ibaraki University | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | all-words 語義曖昧性解消(以下 all-words WSD (word sense disambiguation))とは文書中のすべての単語の語義ラベルを付与するタスクである.単語の語義は文脈,すなわち周辺の単語によって推定でき,周辺の単語同士が類似している場合中心の単語同士の語義も類似していると考える.そこで本研究では,対象単語とその類義語群から周辺単語の分散表現を作成し,ユークリッド距離を計算することで対象単語の語義を予測した.また,語義の予測結果をもとにコーパスを語義ラベル列に変換し,語義の分散表現を作成した.語義の分散表現を用いて周辺単語ベクトルを作成し直し,再び語義の予測を行った.コーパスには分類語彙表番号がアノテーションされた『現代日本語書き言葉均衡コーパス』(BCCWJ) を利用した.本研究では分類語彙表における分類番号を語義とし,類義語も分類語彙表から取得した.本研究では,提案手法とランダムベースライン,Pseudo Most Frequent Sense (PMFS),Yarowsky の手法,LDAWN を比較し,提案手法が勝ることを示した. | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | All-words word-sense disambiguation (all-words WSD) involves identifying the senses of all words in a document. Since a word's sense depends on the context, such as surrounding words, similar words are believed to have similar sets of surrounding words. Therefore, we predict target word senses by calculating Euclidean distances between the target words' surrounding word vectors and their synonyms using word embeddings. In addition, we replace word tokens in the corpus with their concept tags, that is, article numbers of the Word List by Semantic Principles using prediction results. After that, we create concept embeddings with the concept tag sequence and predict the senses of the target words using the distances between surrounding word vectors, which consist the word and concept embeddings. This paper shows that concept embedding improved the performance of Japanese All-words WSD. | |||||
出版者 | ||||||
出版者 | 言語処理学会 | |||||
書誌情報 |
自然言語処理 en : Journal of Natural Language Processing 巻 26, 号 2, p. 361-379, 発行日 2019-06-15 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 1340-7619 | |||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2185-8314 | |||||
DOI | ||||||
関連タイプ | isIdenticalTo | |||||
識別子タイプ | DOI | |||||
関連識別子 | 10.5715/jnlp.26.361 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |