WEKO3
アイテム
{"_buckets": {"deposit": "fc6c7f1a-b2c1-442b-823d-d23e36636db7"}, "_deposit": {"created_by": 3, "id": "3173", "owners": [3], "pid": {"revision_id": 0, "type": "depid", "value": "3173"}, "status": "published"}, "_oai": {"id": "oai:repository.ninjal.ac.jp:00003173", "sets": ["482"]}, "author_link": ["10693", "10694", "10689", "10688", "10687", "5266", "10690", "10692", "10691"], "item_10003_biblio_info_32": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2020", "bibliographicIssueDateType": "Issued"}, "bibliographicPageEnd": "180", "bibliographicPageStart": "174", "bibliographicVolumeNumber": "5", "bibliographic_titles": [{"bibliographic_title": "言語資源活用ワークショップ発表論文集"}, {"bibliographic_title": "Proceedings of Language Resources Workshop", "bibliographic_titleLang": "en"}]}]}, "item_10003_description_27": {"attribute_name": "会議概要(会議名, 開催地, 会期, 主催者等)", "attribute_value_mlt": [{"subitem_description": "会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター", "subitem_description_type": "Other"}]}, "item_10003_description_29": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "BERT が出力する単語の埋め込み表現は,その単語が現れた文の文脈に依存している.このためある単語wの用例を収集し,BERT により得られる単語wに対する埋め込み表現から,それらの分散値を計算すると,その値は単語wの語義の広がりに対応すると考えられる.そこで多義語「頭」「意味」「核」「記録」「言葉」「胸」と単義語「生産」,「政治」,「意識」,「抗議」,「成績」を対象にそれら単語の用例を収集し,分散値の比較を行った.多義語に対しては大きな分散値,単義に対しては小さな分散値が出ることが予想される.またBERT のどの位置の階層が最も語義の広がりに影響しているかも調査した.しかしこれら実験から,上記の分散値では語義の広がりを測定するのは困難であることがわかった.その原因について考察する.", "subitem_description_type": "Abstract"}]}, "item_10003_description_43": {"attribute_name": "フォーマット", "attribute_value_mlt": [{"subitem_description": "application/pdf", "subitem_description_type": "Other"}]}, "item_10003_description_51": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_description": "茨城大学", "subitem_description_type": "Other"}, {"subitem_description": "茨城大学", "subitem_description_type": "Other"}, {"subitem_description": "茨城大学", "subitem_description_type": "Other"}, {"subitem_description": "茨城大学", "subitem_description_type": "Other"}, {"subitem_description": "茨城大学", "subitem_description_type": "Other"}]}, "item_10003_description_52": {"attribute_name": "著者所属(英)", "attribute_value_mlt": [{"subitem_description": "Ibaraki University", "subitem_description_type": "Other"}, {"subitem_description": "Ibaraki University", "subitem_description_type": "Other"}, {"subitem_description": "Ibaraki University", "subitem_description_type": "Other"}, {"subitem_description": "Ibaraki University", "subitem_description_type": "Other"}, {"subitem_description": "Ibaraki University", "subitem_description_type": "Other"}]}, "item_10003_identifier_registration": {"attribute_name": "ID登録", "attribute_value_mlt": [{"subitem_identifier_reg_text": "10.15084/00003157", "subitem_identifier_reg_type": "JaLC"}]}, "item_10003_publisher_45": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "国立国語研究所"}]}, "item_10003_relation_40": {"attribute_name": "関連サイト", "attribute_value_mlt": [{"subitem_relation_name": [{"subitem_relation_name_text": "言語資源活用ワークショップ2020"}], "subitem_relation_type_id": {"subitem_relation_type_id_text": "https://pj.ninjal.ac.jp/corpus_center/lrw2020.html", "subitem_relation_type_select": "URI"}}]}, "item_10003_version_type_44": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "欧, 陽恵子"}], "nameIdentifiers": [{"nameIdentifier": "10687", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "曹, 鋭"}], "nameIdentifiers": [{"nameIdentifier": "10688", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "白, 静"}], "nameIdentifiers": [{"nameIdentifier": "10689", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "馬, ブン"}], "nameIdentifiers": [{"nameIdentifier": "10690", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "新納, 浩幸"}, {"creatorName": "シンノウ, ヒロユキ", "creatorNameLang": "ja-Kana"}, {"creatorName": "Shinnou, Hiroyuki", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "5266", "nameIdentifierScheme": "WEKO"}, {"nameIdentifier": "10250987", "nameIdentifierScheme": "e-Rad", "nameIdentifierURI": "https://nrid.nii.ac.jp/ja/nrid/1000010250987"}, {"nameIdentifier": "read0065655", "nameIdentifierScheme": "researchmap", "nameIdentifierURI": "https://researchmap.jp/read0065655"}]}, {"creatorNames": [{"creatorName": "Ou, Yanghuizi", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "10691", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "Cao, Rui", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "10692", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "Bai, Jing", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "10693", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "Ma, Wen", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "10694", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2021-03-04"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "LRW2020_18_P-3-1.pdf", "filesize": [{"value": "830.1 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 830100.0, "url": {"label": "LRW2020_18_P-3-1.pdf", "url": "https://repository.ninjal.ac.jp/record/3173/files/LRW2020_18_P-3-1.pdf"}, "version_id": "875567e1-34ef-456d-b6df-cfc8f0e272ae"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "現代日本語書き言葉均衡コーパス(BCCWJ)", "subitem_subject_scheme": "Other"}, {"subitem_subject": "岩波国語辞典", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Balanced Corpus of Contemporary Written Japanese (BCCWJ)", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Iwanami Japanese Dictionary", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "conference paper", "resourceuri": "http://purl.org/coar/resource_type/c_5794"}]}, "item_title": "BERTによる単語埋め込み表現の分散値を用いた語義の広がりの分析", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "BERTによる単語埋め込み表現の分散値を用いた語義の広がりの分析"}, {"subitem_title": "Analysis of Polysemy Using Variance Values for Word Embeddings by BERT", "subitem_title_language": "en"}]}, "item_type_id": "10003", "owner": "3", "path": ["482"], "permalink_uri": "https://doi.org/10.15084/00003157", "pubdate": {"attribute_name": "公開日", "attribute_value": "2021-03-05"}, "publish_date": "2021-03-05", "publish_status": "0", "recid": "3173", "relation": {}, "relation_version_is_last": true, "title": ["BERTによる単語埋め込み表現の分散値を用いた語義の広がりの分析"], "weko_shared_id": 3}
BERTによる単語埋め込み表現の分散値を用いた語義の広がりの分析
https://doi.org/10.15084/00003157
https://doi.org/10.15084/00003157f9929079-8aab-4adc-b00d-38d2d509e1b3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-03-05 | |||||||||||
タイトル | ||||||||||||
タイトル | BERTによる単語埋め込み表現の分散値を用いた語義の広がりの分析 | |||||||||||
タイトル | ||||||||||||
言語 | en | |||||||||||
タイトル | Analysis of Polysemy Using Variance Values for Word Embeddings by BERT | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 現代日本語書き言葉均衡コーパス(BCCWJ) | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 岩波国語辞典 | |||||||||||
キーワード | ||||||||||||
言語 | en | |||||||||||
主題Scheme | Other | |||||||||||
主題 | Balanced Corpus of Contemporary Written Japanese (BCCWJ) | |||||||||||
キーワード | ||||||||||||
言語 | en | |||||||||||
主題Scheme | Other | |||||||||||
主題 | Iwanami Japanese Dictionary | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
資源タイプ | conference paper | |||||||||||
ID登録 | ||||||||||||
ID登録 | 10.15084/00003157 | |||||||||||
ID登録タイプ | JaLC | |||||||||||
著者 |
欧, 陽恵子
× 欧, 陽恵子× 曹, 鋭× 白, 静× 馬, ブン× 新納, 浩幸
WEKO
5266
× Ou, Yanghuizi× Cao, Rui× Bai, Jing× Ma, Wen |
|||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター | |||||||||||
抄録 | ||||||||||||
内容記述タイプ | Abstract | |||||||||||
内容記述 | BERT が出力する単語の埋め込み表現は,その単語が現れた文の文脈に依存している.このためある単語wの用例を収集し,BERT により得られる単語wに対する埋め込み表現から,それらの分散値を計算すると,その値は単語wの語義の広がりに対応すると考えられる.そこで多義語「頭」「意味」「核」「記録」「言葉」「胸」と単義語「生産」,「政治」,「意識」,「抗議」,「成績」を対象にそれら単語の用例を収集し,分散値の比較を行った.多義語に対しては大きな分散値,単義に対しては小さな分散値が出ることが予想される.またBERT のどの位置の階層が最も語義の広がりに影響しているかも調査した.しかしこれら実験から,上記の分散値では語義の広がりを測定するのは困難であることがわかった.その原因について考察する. | |||||||||||
書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 5, p. 174-180, 発行日 2020 |
|||||||||||
関連サイト | ||||||||||||
識別子タイプ | URI | |||||||||||
関連識別子 | https://pj.ninjal.ac.jp/corpus_center/lrw2020.html | |||||||||||
関連名称 | 言語資源活用ワークショップ2020 | |||||||||||
フォーマット | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | application/pdf | |||||||||||
著者版フラグ | ||||||||||||
出版タイプ | VoR | |||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||
出版者 | ||||||||||||
出版者 | 国立国語研究所 |