WEKO3
アイテム
コロケーション強度を用いた中古語の語認定
https://doi.org/10.15084/00000483
https://doi.org/10.15084/00000483a408862e-cf32-4747-a14c-cc5f0ae69196
名前 / ファイル | ライセンス | アクション |
---|---|---|
papers0205.pdf (967.7 kB)
|
|
Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2015-10-30 | |||||
タイトル | ||||||
タイトル | コロケーション強度を用いた中古語の語認定 | |||||
タイトル | ||||||
タイトル | Word Identification in Early Middle Japanese Using Collocation Strength | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 形態素解析辞書 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 中古語 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | コロケーション強度 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | ダイス係数 | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | morphological analysis dictionary | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Early Middle Japanese | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | collocation strength | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Dice coefficient | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | departmental bulletin paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00000483 | |||||
ID登録タイプ | JaLC | |||||
著者 |
須永, 哲矢
× 須永, 哲矢× SUNAGA, Tetsuya |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 コーパス開発センター 非常勤研究員 | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Adjunct Researcher, Center for Corpus Development, National Institute for Japanese Language and Linguistics | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 中古和文において,どこからどこまでを一語と認めるかという語認定には,従来明確な尺度がなく,既存の辞書の見出し語をあたっても,立項基準は感覚的・主観的なものであると言わざるを得ない。語と語の結びつきの強さ(コロケーション強度)を具体的な数値で示すダイス係数を取り上げ,「名詞+あり/なし/よし/あし」の組み合わせを例に,語認定の一つの客観的基準として,ダイス係数が有効であることを論じた。 | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | It has long been a serious problem for researchers of Early Middle Japanese to determine whether a set phrase like kai-nashi should be classified as one word or a combination of separate words. There is no definite criterion, and some phrases are listed in dictionaries as a word while others are neglected, all depending on the judgment of the editor. In this paper, the Dice coefficient is introduced as a solution. The Dice coefficient is an index for estimating collocation strength, i.e., how strongly two words are connected with each other. In combination with a morphological analysis dictionary (Chuko-Wabun UniDic), the Dice coefficient works as one criterion for word identification. | |||||
出版者 | ||||||
出版者 | 国立国語研究所 | |||||
書誌情報 |
国立国語研究所論集 en : NINJAL Research Papers 号 2, p. 91-106, 発行日 2011-11 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2186-134X | |||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2186-1358 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AA12536262 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |