ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. その他個人著作物
  2. 小木曽 智信

近代の歴史的資料を対象とした機械学習による文境界推定

https://repository.ninjal.ac.jp/records/3072
https://repository.ninjal.ac.jp/records/3072
dcade003-969d-4748-a204-7d904cb684d8
Item type 学術雑誌論文 / Journal Article(1)
公開日 2020-11-12
タイトル
タイトル 近代の歴史的資料を対象とした機械学習による文境界推定
タイトル
タイトル Machine Learning-based Sentence Boundary Detection for Modern Japanese Texts
言語 en
言語
言語 jpn
キーワード
主題Scheme Other
主題 [特集:人文科学とコンピュータ] 近代文語
キーワード
主題Scheme Other
主題 文境界推定
キーワード
主題Scheme Other
主題 近代語コーパス
キーワード
主題Scheme Other
主題 UniDic
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
アクセス権
アクセス権 metadata only access
アクセス権URI http://purl.org/coar/access_right/c_14cb
著者 白井, 良介

× 白井, 良介

WEKO 10355

白井, 良介

ja-Kana シライ, リョウスケ

Search repository
松村, 雪桜

× 松村, 雪桜

WEKO 10356

松村, 雪桜

ja-Kana マツムラ, ユキオ

Search repository
小木曽, 智信

× 小木曽, 智信

WEKO 10357

小木曽, 智信

ja-Kana オギソ, トシノブ

Search repository
小町, 守

× 小町, 守

WEKO 10358

小町, 守

ja-Kana コマチ, マモル

Search repository
Shirai, Ryosuke

× Shirai, Ryosuke

WEKO 10359

en Shirai, Ryosuke

Search repository
Matsumura, Yukio

× Matsumura, Yukio

WEKO 10360

en Matsumura, Yukio

Search repository
Ogiso, Toshinobu

× Ogiso, Toshinobu

WEKO 10361

en Ogiso, Toshinobu

Search repository
Komachi, Mamoru

× Komachi, Mamoru

WEKO 10362

en Komachi, Mamoru

Search repository
著者所属
内容記述タイプ Other
内容記述 首都大学東京
著者所属
内容記述タイプ Other
内容記述 首都大学東京
著者所属
内容記述タイプ Other
内容記述 国立国語研究所
著者所属
内容記述タイプ Other
内容記述 首都大学東京
著者所属(英)
内容記述タイプ Other
内容記述 Tokyo Metropolitan University
著者所属(英)
内容記述タイプ Other
内容記述 Tokyo Metropolitan University
著者所属(英)
内容記述タイプ Other
内容記述 The National Institute for Japanese Language and Linguistics
著者所属(英)
内容記述タイプ Other
内容記述 Tokyo Metropolitan University
抄録
内容記述タイプ Abstract
内容記述 本稿では,機械学習を用いて近代の歴史的資料に対して文境界を検出する手法を提案する.近代の歴史的資料は明確な文境界が必ずしも存在しないため,これまで人手作業による文境界の付与が行われてきたが,膨大な資料に対してなかなか作業が進んでいない現状がある.そこで我々は機械学習を用いて文境界を検出する手法を提案する.この手法により膨大な量の資料に対して文境界の一次的なアノテーションを施すことができることに加えて,形態素解析の精度を向上させたことが本研究の貢献である.また,モデルの訓練に日本語の近代語のデータを使用して,複数の機械学習手法を比較して近代の歴史的資料を対象とした文境界推定を行うのは本研究が初めてである.
抄録(英)
内容記述タイプ Other
内容記述 In this study, we propose a method to detect sentence boundaries for modern Japanese texts using machine learning. For modern Japanese texts, sentence boundaries are not explicitly marked so that human annotation is inevitable, but the annotation process is far from complete due to enormous number of materials. Therefore, we propose a method to detect sentence boundaries using machine learning. The main contribution of this study is that this method can support the annotation task as a primary annotation. We also show that the accuracy of morphological analysis can be improved by performing sentence boundary detection. Moreover, this is the first work to detect sentence boundaries targeting modern Japanese texts by using modern Japanese data for model training and comparing multiple machine learning methods.
出版者
出版者 情報処理学会
書誌情報 情報処理学会論文誌

巻 61, 号 2, p. 152-161, 発行日 2020-02-15
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7764
書誌レコードID
識別子タイプ NCID
関連識別子 AN00116647
関連サイト
識別子タイプ URI
関連識別子 http://id.nii.ac.jp/1001/00203040/
関連名称 http://id.nii.ac.jp/1001/00203040/
戻る
0
views
See details
Views

Versions

Ver.1 2023-05-15 14:53:43.832474
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR 2.0
  • OAI-PMH JPCOAR 1.0
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3