ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 国立国語研究所論集
  2. 第21号

『現代日本語書き言葉均衡コーパス』書籍サンプルのNDC情報増補 : NDC情報を用いた随筆の抽出と文体調査

https://doi.org/10.15084/00003437
https://doi.org/10.15084/00003437
442dad49-e114-48c1-b23b-2b149742ac40
名前 / ファイル ライセンス アクション
papers2105.pdf papers2105.pdf (829.1 kB)
Item type 紀要論文 / Departmental Bulletin Paper(1)
公開日 2021-07-16
タイトル
タイトル 『現代日本語書き言葉均衡コーパス』書籍サンプルのNDC情報増補 : NDC情報を用いた随筆の抽出と文体調査
タイトル
タイトル Enlargement of Nippon Decimal Classification Metadata of Book Samples in the “Balanced Corpus of Contemporary Written Japanese” : Extraction of Essays from Book Samples According to NDC Metadata and Writing Style Analysis
言語 en
言語
言語 jpn
キーワード
主題Scheme Other
主題 『現代日本語書き言葉均衡コーパス』
キーワード
主題Scheme Other
主題 日本十進分類法
キーワード
主題Scheme Other
主題 文体
キーワード
主題Scheme Other
主題 対数尤度比
キーワード
言語 en
主題Scheme Other
主題 “Balanced Corpus of Contemporary Written Japanese”
キーワード
言語 en
主題Scheme Other
主題 Nippon Decimal Classification
キーワード
言語 en
主題Scheme Other
主題 writing style
キーワード
言語 en
主題Scheme Other
主題 log-likelihood ratio
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ departmental bulletin paper
ID登録
ID登録 10.15084/00003437
ID登録タイプ JaLC
著者 加藤, 祥

× 加藤, 祥

WEKO 11591

加藤, 祥

Search repository
森山, 奈々美

× 森山, 奈々美

WEKO 11592

森山, 奈々美

Search repository
浅原, 正幸

× 浅原, 正幸

WEKO 11593

浅原, 正幸

Search repository
KATO, Sachi

× KATO, Sachi

WEKO 11594

en KATO, Sachi

Search repository
MORIYAMA, Nanami

× MORIYAMA, Nanami

WEKO 11595

en MORIYAMA, Nanami

Search repository
ASAHARA, Masayuki

× ASAHARA, Masayuki

WEKO 11596

en ASAHARA, Masayuki

Search repository
著者所属
内容記述タイプ Other
内容記述 目白大学
著者所属
内容記述タイプ Other
内容記述 国立国語研究所 コーパス開発センター 技術補佐員
著者所属
内容記述タイプ Other
内容記述 国立国語研究所 コーパス開発センター
著者所属(英)
内容記述タイプ Other
内容記述 Mejiro University
著者所属(英)
内容記述タイプ Other
内容記述 Technical Staff, Center for Corpus Development, NINJAL
著者所属(英)
内容記述タイプ Other
内容記述 Center for Corpus Development, NINJAL
抄録
内容記述タイプ Abstract
内容記述 本研究では『現代日本語書き言葉均衡コーパス』(BCCWJ)の書籍全サンプル22,058サンプル(PB(出版)10,117サンプル・LB(図書館)10,551サンプル・OB(ベストセラー)1,390サンプル)に付与された日本十進分類法(NDC)分類記号の補助分類を拡張した。作業は,国立国会図書館サーチのNDC情報を参照し,人手によって分類の確認と追加を行った。また,開発当時NDC分類記号が付与されていなかったサンプル(「分類なし」)などの見直しもあわせて行った。本作業結果により,たとえば形式区分を利用し,ジャンルの分散する「随筆(-049)」「理論(-01)」「教科書(-078)」などのカテゴリでBCCWJサンプルを分類することが可能となった。このほか,時代情報や小項目が追加されたサンプルもあり,今まで以上に詳細な分類が可能となった。本研究では,情報付与作業の方法と基礎情報を報告し,分類例を示す。本データを用いた研究事例として,NDC情報を用いた随筆の抽出と随筆の文体調査結果を報告する。本データは「中納言」の検索で利用できる。
抄録(英)
内容記述タイプ Other
内容記述 This study presents the enlargement of Nippon Decimal Classification (NDC) metadata of book samples in the "Balanced Corpus of Contemporary Written Japanese (BCCWJ)." We revised and enhanced the NDC information about all of the book samples from the BCCWJ (22,058 samples) comprising PB (books in the publication subcorpus: 10,117 samples), LB (books in library subcorpus: 10,551 samples), and OB (books in the special-purpose subcorpus; namely, best sellers: 1,390 samples). We referred to the NDC information using the National Diet Library Search API and manually re-annotated the NDC information. In addition, we completed the empty entries of the original BCCWJ metadata. Based on these procedures, we were able to classify the BCCWJ book samples according to the genres of essay (-049), theory (-01), and textbook (-078) with the NDC supplemental tables. Furthermore, since finer-grained categories, including their chronological periods, were added to some samples, users can explore a more detailed classification of the book samples. We present the methodology of NDC information enlargement and its basic statistics. We also present experimental research on extraction essays from books and the investigation of their writing style. The compiled data can be used in the corpus query systems of "Chunagon."
出版者
出版者 国立国語研究所
書誌情報 国立国語研究所論集
en : NINJAL Research Papers

号 21, p. 65-84, 発行日 2021-07
ISSN
収録物識別子タイプ ISSN
収録物識別子 2186-1358
フォーマット
内容記述タイプ Other
内容記述 application/pdf
著者版フラグ
出版タイプ VoR
出版タイプResource http://purl.org/coar/version/c_970fb48d4fbd8a85
戻る
0
views
See details
Views

Versions

Ver.1 2023-05-15 14:46:11.793301
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR 2.0
  • OAI-PMH JPCOAR 1.0
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3