WEKO3
アイテム
CHJ-WLSP : Annotation of 'Word List by Semantic Principles' Labels for the Corpus of Historical Japanese
https://repository.ninjal.ac.jp/records/3617
https://repository.ninjal.ac.jp/records/361749f0dc5b-27d0-42f8-ab73-c74ceacd44c9
名前 / ファイル | ライセンス | アクション |
---|---|---|
lt4hala2022_31.pdf (545.6 kB)
|
Item type | 会議発表論文 / Conference Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2022-08-17 | |||||
タイトル | ||||||
タイトル | CHJ-WLSP : Annotation of 'Word List by Semantic Principles' Labels for the Corpus of Historical Japanese | |||||
言語 | en | |||||
言語 | ||||||
言語 | eng | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Historical Japanese | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Word Sense Annotation | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者 |
Asahara, Masayuki
× Asahara, Masayuki× Ikegami, Nao× Suzuki, Tai× Ichimura, Taro× Kondo, Asuko× Kato, Sachi× Yamazaki, Makoto |
|||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | National Institute for Japanese Language and Linguistics / Tokyo University of Foreign Studies | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Saitama University | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | University of Tokyo | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Kyoto Prefectural University | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | University of Tokyo | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Mejiro University | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | National Institute for Japanese Language and Linguistics | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | This article presents a word-sense annotation for the Corpus of Historical Japanese: a mashed-up Japanese lexicon based on the 'Word List by Semantic Principles' (WLSP). The WLSP is a large-scale Japanese thesaurus that includes 98,241 entries with syntactic and hierarchical semantic categories. The historical WLSP is also compiled for the words in ancient Japanese. We utilized a morpheme-word sense alignment table to extract all possible word sense candidates for each word appearing in the target corpus. Then, we manually disambiguated the word senses for 647,751 words in the texts from the 10th century to 1910. | |||||
書誌情報 |
en : Proceedings of the Second Workshop on Language Technologies for Historical and Ancient Languages(LT4HALA 2022) p. 31-37, 発行日 2022 |
|||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
出版者 | ||||||
出版者 | European Language Resources Association |