WEKO3
アイテム
{"_buckets": {"deposit": "535bef71-3d4a-4a79-b53f-bd4cf826779c"}, "_deposit": {"created_by": 3, "id": "1659", "owners": [3], "pid": {"revision_id": 0, "type": "depid", "value": "1659"}, "status": "published"}, "_oai": {"id": "oai:repository.ninjal.ac.jp:00001659", "sets": ["268"]}, "author_link": ["5265", "5264", "5498", "5497", "4506", "5266"], "item_10003_biblio_info_32": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2018", "bibliographicIssueDateType": "Issued"}, "bibliographicPageEnd": "117", "bibliographicPageStart": "112", "bibliographicVolumeNumber": "3", "bibliographic_titles": [{"bibliographic_title": "言語資源活用ワークショップ発表論文集"}, {"bibliographic_title": "Proceedings of Language Resources Workshop", "bibliographic_titleLang": "en"}]}]}, "item_10003_description_27": {"attribute_name": "会議概要(会議名, 開催地, 会期, 主催者等)", "attribute_value_mlt": [{"subitem_description": "会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター", "subitem_description_type": "Other"}]}, "item_10003_description_29": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "日本語歴史コーパス中の単語には、現代語と同様の意味で扱われている単語と、古語特有の意味を持つ単語がある。本研究では、この現代語にはない古語特有の単語の語義(言葉の意味)を未知語義と定義して、日本語歴史コーパス中から、未知語義を検出するシステムの提案を行う。具体的には、日本語歴史コーパス中の単語を、(1)現代の分類語彙表でその単語の分類番号として登録されている語義をもつ語、(2)現代の分類語彙表にある語義をもつが、現在その語義は、その言葉の語義として分類語彙表は登録されていない語、(3)その語義の定義が現代の分類語彙表にないため、分類番号が振られていない語、の3種類にクラス分けする。実験では、各単語について、出現書字形や見出しなどの8要素を基本素性として用いた。また、別の日本語歴史コーパスからword2vecを用いて、3種類の単語の分散表現のベクトル(50次元、100次元、200次元)を作成し、素性として加えた。それぞれSVMを用いて正解率を比較したところ、日本語歴史コーパス中の未知語義の検出において、単語の分散表現のベクトルが正解率を向上させることが分かった。", "subitem_description_type": "Abstract"}]}, "item_10003_description_43": {"attribute_name": "フォーマット", "attribute_value_mlt": [{"subitem_description": "application/pdf", "subitem_description_type": "Other"}]}, "item_10003_description_51": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_description": "茨城大学", "subitem_description_type": "Other"}, {"subitem_description": "茨城大学", "subitem_description_type": "Other"}, {"subitem_description": "国立国語研究所", "subitem_description_type": "Other"}, {"subitem_description": "茨城大学", "subitem_description_type": "Other"}, {"subitem_description": "茨城大学", "subitem_description_type": "Other"}]}, "item_10003_description_52": {"attribute_name": "著者所属(英)", "attribute_value_mlt": [{"subitem_description": "Ibaraki University", "subitem_description_type": "Other"}, {"subitem_description": "Ibaraki University", "subitem_description_type": "Other"}, {"subitem_description": "National Institute for Japanese Language and Linguistics", "subitem_description_type": "Other"}, {"subitem_description": "Ibaraki University", "subitem_description_type": "Other"}, {"subitem_description": "Ibaraki University", "subitem_description_type": "Other"}]}, "item_10003_identifier_registration": {"attribute_name": "ID登録", "attribute_value_mlt": [{"subitem_identifier_reg_text": "10.15084/00001643", "subitem_identifier_reg_type": "JaLC"}]}, "item_10003_publisher_45": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "国立国語研究所"}]}, "item_10003_relation_40": {"attribute_name": "関連サイト", "attribute_value_mlt": [{"subitem_relation_name": [{"subitem_relation_name_text": "言語資源活用ワークショップ2018"}], "subitem_relation_type_id": {"subitem_relation_type_id_text": "https://pj.ninjal.ac.jp/corpus_center/lrw2018.html", "subitem_relation_type_select": "URI"}}]}, "item_10003_version_type_44": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "田邊, 絢"}, {"creatorName": "タナベ, アヤ", "creatorNameLang": "ja-Kana"}], "nameIdentifiers": [{"nameIdentifier": "5497", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "古宮, 嘉那子"}, {"creatorName": "コミヤ, カナコ", "creatorNameLang": "ja-Kana"}, {"creatorName": "KOMIYA, Kanako", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "5264", "nameIdentifierScheme": "WEKO"}, {"nameIdentifier": "10592339", "nameIdentifierScheme": "e-Rad", "nameIdentifierURI": "https://nrid.nii.ac.jp/ja/nrid/1000010592339"}, {"nameIdentifier": "7000007337", "nameIdentifierScheme": "researchmap", "nameIdentifierURI": "https://researchmap.jp/7000007337"}]}, {"creatorNames": [{"creatorName": "浅原, 正幸"}, {"creatorName": "アサハラ, マサユキ", "creatorNameLang": "ja-Kana"}, {"creatorName": "ASAHARA, Masayuki", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "4506", "nameIdentifierScheme": "WEKO"}, {"nameIdentifier": "80379528", "nameIdentifierScheme": "e-Rad", "nameIdentifierURI": "https://nrid.nii.ac.jp/ja/nrid/1000080379528"}, {"nameIdentifier": "read0072010", "nameIdentifierScheme": "researchmap", "nameIdentifierURI": "https://researchmap.jp/read0072010"}]}, {"creatorNames": [{"creatorName": "佐々木, 稔"}, {"creatorName": "ササキ, ミノル", "creatorNameLang": "ja-Kana"}, {"creatorName": "SASAKI, Minoru", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "5265", "nameIdentifierScheme": "WEKO"}, {"nameIdentifier": "60344834", "nameIdentifierScheme": "e-Rad", "nameIdentifierURI": "https://nrid.nii.ac.jp/ja/nrid/1000060344834"}, {"nameIdentifier": "read0200491", "nameIdentifierScheme": "researchmap", "nameIdentifierURI": "https://researchmap.jp/read0200491"}]}, {"creatorNames": [{"creatorName": "新納, 浩幸"}, {"creatorName": "シンノウ, ヒロユキ", "creatorNameLang": "ja-Kana"}, {"creatorName": "SHINNOU, Hiroyuki", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "5266", "nameIdentifierScheme": "WEKO"}, {"nameIdentifier": "10250987", "nameIdentifierScheme": "e-Rad", "nameIdentifierURI": "https://nrid.nii.ac.jp/ja/nrid/1000010250987"}, {"nameIdentifier": "read0065655", "nameIdentifierScheme": "researchmap", "nameIdentifierURI": "https://researchmap.jp/read0065655"}]}, {"creatorNames": [{"creatorName": "TANABE, Aya", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "5498", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2019-02-14"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "LRW-2018-12-P-1-07.pdf", "filesize": [{"value": "619.8 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 619800.0, "url": {"label": "LRW-2018-12-P-1-07.pdf", "url": "https://repository.ninjal.ac.jp/record/1659/files/LRW-2018-12-P-1-07.pdf"}, "version_id": "d308e557-92b7-4c2e-95f6-7e18cb0d652e"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "分類語彙表", "subitem_subject_scheme": "Other"}, {"subitem_subject": "日本語歴史コーパス(CHJ)", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Word List by Semantic Principles", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Corpus of Historical Japanese (CHJ)", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "conference paper", "resourceuri": "http://purl.org/coar/resource_type/c_5794"}]}, "item_title": "日本語歴史コーパスの現代語辞書における未知語義判定システム", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "日本語歴史コーパスの現代語辞書における未知語義判定システム"}, {"subitem_title": "Detecting Unknown Word Senses in Contemporary Japanese Dictionary from Corpus of Historical Japanese", "subitem_title_language": "en"}]}, "item_type_id": "10003", "owner": "3", "path": ["268"], "permalink_uri": "https://doi.org/10.15084/00001643", "pubdate": {"attribute_name": "公開日", "attribute_value": "2019-02-14"}, "publish_date": "2019-02-14", "publish_status": "0", "recid": "1659", "relation": {}, "relation_version_is_last": true, "title": ["日本語歴史コーパスの現代語辞書における未知語義判定システム"], "weko_shared_id": -1}
日本語歴史コーパスの現代語辞書における未知語義判定システム
https://doi.org/10.15084/00001643
https://doi.org/10.15084/00001643ded12eb3-b876-4615-9ee9-472eac2a1733
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2019-02-14 | |||||||||||||||||
タイトル | ||||||||||||||||||
タイトル | 日本語歴史コーパスの現代語辞書における未知語義判定システム | |||||||||||||||||
タイトル | ||||||||||||||||||
言語 | en | |||||||||||||||||
タイトル | Detecting Unknown Word Senses in Contemporary Japanese Dictionary from Corpus of Historical Japanese | |||||||||||||||||
言語 | ||||||||||||||||||
言語 | jpn | |||||||||||||||||
キーワード | ||||||||||||||||||
主題Scheme | Other | |||||||||||||||||
主題 | 分類語彙表 | |||||||||||||||||
キーワード | ||||||||||||||||||
主題Scheme | Other | |||||||||||||||||
主題 | 日本語歴史コーパス(CHJ) | |||||||||||||||||
キーワード | ||||||||||||||||||
言語 | en | |||||||||||||||||
主題Scheme | Other | |||||||||||||||||
主題 | Word List by Semantic Principles | |||||||||||||||||
キーワード | ||||||||||||||||||
言語 | en | |||||||||||||||||
主題Scheme | Other | |||||||||||||||||
主題 | Corpus of Historical Japanese (CHJ) | |||||||||||||||||
資源タイプ | ||||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||||
資源タイプ | conference paper | |||||||||||||||||
ID登録 | ||||||||||||||||||
ID登録 | 10.15084/00001643 | |||||||||||||||||
ID登録タイプ | JaLC | |||||||||||||||||
著者 |
田邊, 絢
× 田邊, 絢× 古宮, 嘉那子× 浅原, 正幸
WEKO
4506
× 佐々木, 稔× 新納, 浩幸
WEKO
5266
× TANABE, Aya |
|||||||||||||||||
著者所属 | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 茨城大学 | |||||||||||||||||
著者所属 | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 茨城大学 | |||||||||||||||||
著者所属 | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 国立国語研究所 | |||||||||||||||||
著者所属 | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 茨城大学 | |||||||||||||||||
著者所属 | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 茨城大学 | |||||||||||||||||
著者所属(英) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | Ibaraki University | |||||||||||||||||
著者所属(英) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | Ibaraki University | |||||||||||||||||
著者所属(英) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | National Institute for Japanese Language and Linguistics | |||||||||||||||||
著者所属(英) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | Ibaraki University | |||||||||||||||||
著者所属(英) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | Ibaraki University | |||||||||||||||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター | |||||||||||||||||
抄録 | ||||||||||||||||||
内容記述タイプ | Abstract | |||||||||||||||||
内容記述 | 日本語歴史コーパス中の単語には、現代語と同様の意味で扱われている単語と、古語特有の意味を持つ単語がある。本研究では、この現代語にはない古語特有の単語の語義(言葉の意味)を未知語義と定義して、日本語歴史コーパス中から、未知語義を検出するシステムの提案を行う。具体的には、日本語歴史コーパス中の単語を、(1)現代の分類語彙表でその単語の分類番号として登録されている語義をもつ語、(2)現代の分類語彙表にある語義をもつが、現在その語義は、その言葉の語義として分類語彙表は登録されていない語、(3)その語義の定義が現代の分類語彙表にないため、分類番号が振られていない語、の3種類にクラス分けする。実験では、各単語について、出現書字形や見出しなどの8要素を基本素性として用いた。また、別の日本語歴史コーパスからword2vecを用いて、3種類の単語の分散表現のベクトル(50次元、100次元、200次元)を作成し、素性として加えた。それぞれSVMを用いて正解率を比較したところ、日本語歴史コーパス中の未知語義の検出において、単語の分散表現のベクトルが正解率を向上させることが分かった。 | |||||||||||||||||
書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 3, p. 112-117, 発行日 2018 |
|||||||||||||||||
関連サイト | ||||||||||||||||||
識別子タイプ | URI | |||||||||||||||||
関連識別子 | https://pj.ninjal.ac.jp/corpus_center/lrw2018.html | |||||||||||||||||
関連名称 | 言語資源活用ワークショップ2018 | |||||||||||||||||
フォーマット | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | application/pdf | |||||||||||||||||
著者版フラグ | ||||||||||||||||||
出版タイプ | VoR | |||||||||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||
出版者 | ||||||||||||||||||
出版者 | 国立国語研究所 |