@inproceedings{oai:repository.ninjal.ac.jp:00001528, author = {新納, 浩幸 and 古宮, 嘉那子 and 佐々木, 稔 and SHINNOU, Hiroyuki and KOMIYA, Kanako and SASAKI, Minoru}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター, nwjc2vec は国語研日本語ウェブコーパス(NWJC)から構築された分散表現データである。NWJC が超巨大コーパスであるため,nwjc2vec の品質はかなり高いと考えられる。ただし分散表現データを実際の自然言語処理システムに利用する際には,そのシステムが対象とする領域に依存した分散表現データの方が望ましい。これは領域適応の問題である。ここでは処理対象を新聞記事として,新聞記事7年分から構築した分散表現データと nwjc2vec を比較することでこの点を確認する。またこの問題の対処として nwjc2vec に対して少量の新聞記事を利用してfine-tuning を行い,その効果を確認する。, application/pdf, 茨城大学, 茨城大学, 茨城大学}, pages = {117--122}, publisher = {国立国語研究所}, title = {nwjc2vecのfine-tuning}, volume = {2}, year = {2017}, yomi = {シンノウ, ヒロユキ and コミヤ, カナコ and ササキ, ミノル} }