WEKO3
アイテム
テキストからの対象物認識に有用な記述内容 : 動物を例に
https://doi.org/10.15084/00000460
https://doi.org/10.15084/0000046083a245d4-46ad-418a-8e02-bda98dfbda50
名前 / ファイル | ライセンス | アクション |
---|---|---|
papers0902.pdf (1.1 MB)
|
|
Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2015-10-30 | |||||
タイトル | ||||||
タイトル | テキストからの対象物認識に有用な記述内容 : 動物を例に | |||||
タイトル | ||||||
タイトル | Encyclopaedic Descriptions That are Useful for Identifying Entities: A Case Study of Descriptions of Animals | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 百科事典的知識 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 対象物認知 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | コーパス | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | カテゴリ化 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 意味記述 | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | encyclopaedic knowledge | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | object recognition | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | corpus | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | categorisation | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | description of word meaning | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | departmental bulletin paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00000460 | |||||
ID登録タイプ | JaLC | |||||
著者 |
加藤, 祥
× 加藤, 祥× KATO, Sachi |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 コーパス開発センター プロジェクト研究員 | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Postdoctoral Research Fellow, Center for Corpus Development, NINJAL | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | テキストの示す対象物を認識するために,どのような内容を記述することが有用か。本稿では,動物を例にした3種類の実験に基づく考察結果を報告する。複数辞書に共通して記載のある語釈,辞書の語釈に不足しているとされた情報を追加したテキスト,コーパス(現代日本語書き言葉均衡コーパス・Google日本語n-gram)から取得した用例を用い,それぞれのテキストから対象物を同定する実験を行った。どの実験結果でも正答率は半数程度にとどまり,テキストのみからの対象物認識は困難であった。また,対象物の認識に求められた情報は,主に読み手の経験や知識を喚起する情報と,提示された情報によって設定したカテゴリにおける他メンバーとの差異に関する情報であった。我々が実際目にするテキスト(コーパス)からは,個別的一般的な経験や知識は取得しやすく,予め読み手の保有している知識と合致した場合には有用な情報となる。しかし,対象物に関する知識が読み手に不足している場合,対象物の認識には親カテゴリのプロトタイプとの差異を記述することが有用であり,あるいは誤認を避けるために他メンバーとの差別化が可能な記述を行うことが有用であるとわかった。 | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | This paper reports what features of encyclopaedic descriptions are useful for recognising entities based on the results of three experiments on target object identification from texts. We used gloss descriptions of animals compiled from dictionaries (Experiment 1), texts with additional information not found in the dictionaries (Experiment 2), and usages acquired from corpora (Balanced Corpus of Contemporary Written Japanese, Google Japanese N-grams; Experiment 3). In all three experiments, the percentage of the entities which could be identified correctly from texts was only about half. Therefore, we conclude that it is difficult to recognise an entity based on its description in a text. The results of the three experiments suggest that the following information is important for the identification of the target: specific features selected based on participants' personal experiences and information that would distinguish the target animals from other members in the ad hoc categories were important for identification of the target. When readers have knowledge about the target entities, individual or general experience and knowledge are easily obtained from corpora, as the actual texts are useful for readers' recognition. In contrast, when readers have insufficient knowledge about the target entities, a description of the features that distinguish the target from the prototype of the superordinate category (ad hoc category) is useful. | |||||
出版者 | ||||||
出版者 | 国立国語研究所 | |||||
書誌情報 |
国立国語研究所論集 en : NINJAL Research Papers 号 9, p. 23-50, 発行日 2015-07 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2186-134X | |||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2186-1358 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AA12536262 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |