WEKO3
アイテム
『現代日本語書き言葉均衡コーパス』新聞記事情報を用いたジャンル別語彙分布
https://doi.org/10.15084/00003489
https://doi.org/10.15084/000034896322bab2-07c2-4e4a-b9b2-dd2e70613440
名前 / ファイル | ライセンス | アクション |
---|---|---|
LRW2021_14-p2-2.pdf (1.3 MB)
|
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2022-01-07 | |||||||||||
タイトル | ||||||||||||
タイトル | 『現代日本語書き言葉均衡コーパス』新聞記事情報を用いたジャンル別語彙分布 | |||||||||||
タイトル | ||||||||||||
タイトル | The Lexical Distribution by the Topic annotation data on the Newspaper Articles in the Balanced Corpus of Contemporary Written Japanese | |||||||||||
言語 | en | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 分類語彙表 | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 現代日本語書き言葉均衡コーパス(BCCWJ) | |||||||||||
キーワード | ||||||||||||
言語 | en | |||||||||||
主題Scheme | Other | |||||||||||
主題 | Word List by Semantic Principles (WLSP) | |||||||||||
キーワード | ||||||||||||
言語 | en | |||||||||||
主題Scheme | Other | |||||||||||
主題 | Balanced Corpus of Contemporary Written Japanese (BCCWJ) | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
資源タイプ | conference paper | |||||||||||
ID登録 | ||||||||||||
ID登録 | 10.15084/00003489 | |||||||||||
ID登録タイプ | JaLC | |||||||||||
著者 |
加藤, 祥
× 加藤, 祥× 森山, 奈々美× 浅原, 正幸
WEKO
4506
× MORIYAMA, Nanami |
|||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 目白大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 国立国語研究所 | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Mejiro University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | National Institute for Japanese Language and Linguistics | |||||||||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 会議名: 言語資源活用ワークショップ2021, 開催地: オンライン, 会期: 2021年9月13日-14日, 主催: 国立国語研究所 コーパス開発センター | |||||||||||
抄録 | ||||||||||||
内容記述タイプ | Abstract | |||||||||||
内容記述 | コーパスに付与されたジャンル情報を用いることにより,ジャンル毎の語彙分布の傾向が確認される。しかし,レジスタによる文体差の影響や,ジャンルの分類基準の問題が考えられる。そこで,本稿は,文章内容情報が付与された文体的な影響の少ないコーパスを用い,品詞分布・語彙分布・語義分布に内容別の傾向が見られることを確認する。具体的には,『現代日本語書き言葉均衡コーパス』の新聞サブコーパス(PN,1,473サンプル)に含まれるサンプルを記事単位(5,585記事)に分割し,記事ごとの内容情報や種別情報を付与した(加藤ほか2020)データを用いる。分類語彙表番号の付与されたBCCWJ-WLSP(加藤ほか2019)と重ね合わせることにより語義分布も調査する。 | |||||||||||
書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 6, p. 160-170, 発行日 2021 |
|||||||||||
関連サイト | ||||||||||||
識別子タイプ | URI | |||||||||||
関連識別子 | https://ccd.ninjal.ac.jp/lrw2021.html | |||||||||||
関連名称 | 言語資源活用ワークショップ2021 | |||||||||||
フォーマット | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | application/pdf | |||||||||||
著者版フラグ | ||||||||||||
出版タイプ | VoR | |||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||
出版者 | ||||||||||||
出版者 | 国立国語研究所 |