@article{oai:repository.ninjal.ac.jp:02000013, author = {加藤, 祥 and KATO, Sachi and 浅原, 正幸 and ASAHARA, Masayuki}, journal = {国立国語研究所論集, NINJAL Research Papers}, month = {Jul}, note = {目白大学, 国立国語研究所 研究系, Mejiro University, Research Department, NINJAL, 我々は『現代日本語書き言葉均衡コーパス』の書籍サンプルに含まれるすべての小説サンプルについて,小説の内容に関するジャンルや舞台設定等の分類情報(「推理」「SF」「アドベンチャー」「ロマンス」など)を付与した。分類情報の策定にあたっては,小説サンプルの取得された各書籍について,書店や出版社の分類情報をはじめ,小説の内容を表すと複数作業者が判断した特徴語句を広く収集し,結果を整理した。各小説サンプルには様々な分類項目を重複して付与した。本稿の作業により,これまで分類されていなかった小説の分類情報が付与された。新たに付与された分類情報により,分類別の語彙分布や文体特徴が確認できるようになった。本稿では,作業手順と情報付与結果を報告する。, We categorized genres and settings (e.g., "Mystery," "Science," "Adventure," "Romance," and "Historical") for all fiction works in book samples from the Balanced Corpus of Contemporary Written Japanese. To design the descriptive genre attributes, we explored the classification items of bookshops and publishers. We also newly defined the classification items by exploring characteristic words and phrases in the fiction contents. Thus, we annotated the designed classification items of genre attributes in a multi-label classification setting. The work described in this study enabled the assignment of new classification information for fiction samples in the Balanced Corpus of Contemporary Written Japanese. The genre attributes enabled us to confirm the distribution of vocabulary and stylistic features. We reported the annotation procedures and results of the classification items of the genre attributes., application/pdf}, pages = {59--74}, title = {『現代日本語書き言葉均衡コーパス』の小説サンプルに対する分類情報付与}, volume = {25}, year = {2023} }