WEKO3
アイテム
二言語BERTを利用したターゲット言語の教師データを必要としない感情分析
https://doi.org/10.15084/00003159
https://doi.org/10.15084/0000315931e5d44a-92b0-4ba2-84d7-0ce489b5c85a
名前 / ファイル | ライセンス | アクション |
---|---|---|
LRW2020_20_P-3-3.pdf (914.3 kB)
|
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-03-05 | |||||||||||
タイトル | ||||||||||||
タイトル | 二言語BERTを利用したターゲット言語の教師データを必要としない感情分析 | |||||||||||
タイトル | ||||||||||||
タイトル | Sentiment Analysis That Does Not Require Training Data in the Target Language Using Billingual BERT | |||||||||||
言語 | en | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 田中コーパス | |||||||||||
キーワード | ||||||||||||
言語 | en | |||||||||||
主題Scheme | Other | |||||||||||
主題 | Tanaka Corpus | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
資源タイプ | conference paper | |||||||||||
ID登録 | ||||||||||||
ID登録 | 10.15084/00003159 | |||||||||||
ID登録タイプ | JaLC | |||||||||||
著者 |
荘司, 響之介
× 荘司, 響之介× 曹, 鋭× 白, 静× 馬, ブン× 新納, 浩幸
WEKO
5266
× Syouji, Kyonosuke× Cao, Rui× Bai, Jing× Ma, Wen |
|||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 茨城大学 | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Ibaraki University | |||||||||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター | |||||||||||
抄録 | ||||||||||||
内容記述タイプ | Abstract | |||||||||||
内容記述 | 文書分類のタスクを教師あり学習で解く場合、大量のラベル付きデータ(教師データ)が必要であり、このデータの構築コストが高いという問題がある。ただし、英語などのメジャーな言語に対しては、ラベル付けされたデータが既に存在していることも多い。この場合、英語側では分類器を学習できるため、その学習できた知識を、タスクの対象となっている言語側へ転移できれば、ターゲット言語での教師データを利用せずに、分類器を構築することができる。本論文ではそのような転移を行うためにBERTを用いる。具体的には、英語BERTを用いて英語の訓練文書をベクトル化し、それをもとに分類器を学習する。次に、ターゲット領域の文書となる日本語の文書を、日本語BERTを用いてベクトル化する。あらかじめ学習しておいた2言語間のBERTの変換器を用いて日本語の文書ベクトルを英語のベクトル空間に埋め込み、先の分類器によって識別する。これによって、ターゲット言語である日本語の訓練文書を利用せずに、日本語の文書の感情分析が可能となる。 | |||||||||||
書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 5, p. 189-195, 発行日 2020 |
|||||||||||
関連サイト | ||||||||||||
識別子タイプ | URI | |||||||||||
関連識別子 | https://pj.ninjal.ac.jp/corpus_center/lrw2020.html | |||||||||||
関連名称 | 言語資源活用ワークショップ2020 | |||||||||||
フォーマット | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | application/pdf | |||||||||||
著者版フラグ | ||||||||||||
出版タイプ | VoR | |||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||
出版者 | ||||||||||||
出版者 | 国立国語研究所 |