WEKO3
アイテム
〈共同研究プロジェクト紹介〉萌芽・発掘型 : テキストの多様性を捉える分類指標の策定 書籍サンプルの文体を分類する
https://doi.org/10.15084/00000730
https://doi.org/10.15084/0000073065375497-0f5d-4d9f-8fb7-b9aad036a418
名前 / ファイル | ライセンス | アクション |
---|---|---|
review040106.pdf (1.3 MB)
|
|
Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2015-10-30 | |||||
タイトル | ||||||
タイトル | 〈共同研究プロジェクト紹介〉萌芽・発掘型 : テキストの多様性を捉える分類指標の策定 書籍サンプルの文体を分類する | |||||
タイトル | ||||||
タイトル | Classifying Writing Styles of Book Samples | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | departmental bulletin paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00000730 | |||||
ID登録タイプ | JaLC | |||||
著者 |
柏野, 和佳子
× 柏野, 和佳子× KASHINO, Wakako |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所言語資源研究系 | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 文体研究などへのコーパスの有効活用を図るため,コーパスの書籍サンプルを文体によって特徴づけることを目的に,書籍サンプルの分類指標の設計と付与を行った。対象はBCCWJ図書館サブコーパス収録の全10,551サンプルである。テキスト構造が単純(例:章節構造)なもの(全体の84%)については,内容・表現の文体的特徴により,専門度,客観度,硬度,くだけ度,および語りかけ性度,という5観点による分類指標を定め,主観的評定によって評価値を付与した。また,テキスト構造・紙面形式などの点で上記分類になじまないもの(全体の16%)を見出し,その特徴を表す別の指標を設定した。これらを通じて,図書館サブコーパスに収録される全サンプルの多種多様な形式の類型ごとの分布や,各類型のNDC ごとの頻度が明らかになった。 | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | To facilitate the use of BCCWJ for writing style studies, we proposed a feature index system that characterizes the writing styles of the book samples in the corpus and then, following the proposed system, annotated all of the 10,551 samples included in its library subcorpus. For the samples with a simple text structure (84%), we chose five axes (specificity, objectivity, formality, softness, and spokenness) and assigned a five-dimensional index to each sample based on a subjective assessment. For the remaining samples (16%), that is, the samples with a complex text structure or some specific format, we employed a different set of feature annotations. This approach allowed a systematic analysis of the diverse writing styles of the samples included in the library subcorpus. Statistics such as the number of samples with a specific style feature, and correlations between the styles and NDC (Nippon Decimal Classification) categories were obtained. | |||||
出版者 | ||||||
出版者 | 国立国語研究所 | |||||
書誌情報 |
国語研プロジェクトレビュー en : NINJAL Project Review 巻 4, 号 1, p. 43-53, 発行日 2013-06 |
|||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2185-0100 | |||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 2185-0119 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AA12480598 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |