WEKO3
アイテム
コロケーション強度を用いた中古語の語認定
https://doi.org/10.15084/00000483
https://doi.org/10.15084/00000483a408862e-cf32-4747-a14c-cc5f0ae69196
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
| Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||
|---|---|---|---|---|---|---|
| 公開日 | 2015-10-30 | |||||
| タイトル | ||||||
| タイトル | コロケーション強度を用いた中古語の語認定 | |||||
| タイトル | ||||||
| タイトル | Word Identification in Early Middle Japanese Using Collocation Strength | |||||
| 言語 | en | |||||
| 言語 | ||||||
| 言語 | jpn | |||||
| キーワード | ||||||
| 主題Scheme | Other | |||||
| 主題 | 形態素解析辞書 | |||||
| キーワード | ||||||
| 主題Scheme | Other | |||||
| 主題 | 中古語 | |||||
| キーワード | ||||||
| 主題Scheme | Other | |||||
| 主題 | コロケーション強度 | |||||
| キーワード | ||||||
| 主題Scheme | Other | |||||
| 主題 | ダイス係数 | |||||
| キーワード | ||||||
| 言語 | en | |||||
| 主題Scheme | Other | |||||
| 主題 | morphological analysis dictionary | |||||
| キーワード | ||||||
| 言語 | en | |||||
| 主題Scheme | Other | |||||
| 主題 | Early Middle Japanese | |||||
| キーワード | ||||||
| 言語 | en | |||||
| 主題Scheme | Other | |||||
| 主題 | collocation strength | |||||
| キーワード | ||||||
| 言語 | en | |||||
| 主題Scheme | Other | |||||
| 主題 | Dice coefficient | |||||
| 資源タイプ | ||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
| 資源タイプ | departmental bulletin paper | |||||
| ID登録 | ||||||
| ID登録 | 10.15084/00000483 | |||||
| ID登録タイプ | JaLC | |||||
| 著者 |
須永, 哲矢
× 須永, 哲矢× SUNAGA, Tetsuya |
|||||
| 著者所属 | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | 国立国語研究所 コーパス開発センター 非常勤研究員 | |||||
| 著者所属(英) | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | Adjunct Researcher, Center for Corpus Development, National Institute for Japanese Language and Linguistics | |||||
| 抄録 | ||||||
| 内容記述タイプ | Abstract | |||||
| 内容記述 | 中古和文において,どこからどこまでを一語と認めるかという語認定には,従来明確な尺度がなく,既存の辞書の見出し語をあたっても,立項基準は感覚的・主観的なものであると言わざるを得ない。語と語の結びつきの強さ(コロケーション強度)を具体的な数値で示すダイス係数を取り上げ,「名詞+あり/なし/よし/あし」の組み合わせを例に,語認定の一つの客観的基準として,ダイス係数が有効であることを論じた。 | |||||
| 抄録(英) | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | It has long been a serious problem for researchers of Early Middle Japanese to determine whether a set phrase like kai-nashi should be classified as one word or a combination of separate words. There is no definite criterion, and some phrases are listed in dictionaries as a word while others are neglected, all depending on the judgment of the editor. In this paper, the Dice coefficient is introduced as a solution. The Dice coefficient is an index for estimating collocation strength, i.e., how strongly two words are connected with each other. In combination with a morphological analysis dictionary (Chuko-Wabun UniDic), the Dice coefficient works as one criterion for word identification. | |||||
| 出版者 | ||||||
| 出版者 | 国立国語研究所 | |||||
| 書誌情報 |
国立国語研究所論集 en : NINJAL Research Papers 号 2, p. 91-106, 発行日 2011-11 |
|||||
| ISSN | ||||||
| 収録物識別子タイプ | ISSN | |||||
| 収録物識別子 | 2186-134X | |||||
| ISSN | ||||||
| 収録物識別子タイプ | ISSN | |||||
| 収録物識別子 | 2186-1358 | |||||
| 書誌レコードID | ||||||
| 収録物識別子タイプ | NCID | |||||
| 収録物識別子 | AA12536262 | |||||
| フォーマット | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | application/pdf | |||||
| 著者版フラグ | ||||||
| 出版タイプ | VoR | |||||
| 出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||