WEKO3
アイテム
科学技術系ライティング教材作成のためのComainuを利用した日本語学術文技術文長単位解析
https://doi.org/10.15084/00003166
https://doi.org/10.15084/000031665c4eea0f-f50d-4c4b-b9bc-0ef85db42913
名前 / ファイル | ライセンス | アクション |
---|---|---|
LRW2020_27_P-3-10.pdf (342.0 kB)
|
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-03-05 | |||||||||||
タイトル | ||||||||||||
タイトル | 科学技術系ライティング教材作成のためのComainuを利用した日本語学術文技術文長単位解析 | |||||||||||
タイトル | ||||||||||||
タイトル | Long-Unit-Word Morphological Analysis on Japanese Academic and Technical Research Paper Corpora Using Comainu for Providing the Learning Contents for Science Academic Writing | |||||||||||
言語 | en | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 国立国語研究所教育基本語彙 | |||||||||||
キーワード | ||||||||||||
言語 | en | |||||||||||
主題Scheme | Other | |||||||||||
主題 | Fundamental Vocabulary Used for Educational Purposes | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
資源タイプ | conference paper | |||||||||||
ID登録 | ||||||||||||
ID登録 | 10.15084/00003166 | |||||||||||
ID登録タイプ | JaLC | |||||||||||
著者 |
堀, 一成
× 堀, 一成× 坂尻, 彰宏
WEKO
10651
|
|||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 大阪大学 | |||||||||||
著者所属 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 大阪大学 | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Osaka University | |||||||||||
著者所属(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | Osaka University | |||||||||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター | |||||||||||
抄録 | ||||||||||||
内容記述タイプ | Abstract | |||||||||||
内容記述 | 大学学部初年次生向け科学技術系日本語アカデミック・ライティング指導教材を作成する際の基礎データとするため、学術文・技術文の長単位による形態素解析を行い、用いられている(基本語彙を除く)一般動詞の頻度情報を得た。長単位形態素解析に用いたソフトウェアは、小澤俊介氏らの開発したComainu-0.72 を採用した。学術文の代表として、大阪大学に提出された理学・工学・医学・薬学などの日本語博士学位論文の本文(107件でデータ量は、全角文字数で約450万字)を、技術文の代表として、大阪産業技術研究所が公開している技術報告文(486文書、データ量全角文字数で約35 万字) を、解析の対象として選定した。より専門的な語彙を抽出するため、国立国語研究所の国語研教育基本語彙のうち、特に基本的とされる2000語に含まれる動詞を除く処理も行った。本報告では、研究の背景、ソフトウェア実行手順、得られた成果に対する考察などを紹介する。 | |||||||||||
書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 5, p. 267-273, 発行日 2020 |
|||||||||||
関連サイト | ||||||||||||
識別子タイプ | URI | |||||||||||
関連識別子 | https://pj.ninjal.ac.jp/corpus_center/lrw2020.html | |||||||||||
関連名称 | 言語資源活用ワークショップ2020 | |||||||||||
フォーマット | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | application/pdf | |||||||||||
著者版フラグ | ||||||||||||
出版タイプ | VoR | |||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||
出版者 | ||||||||||||
出版者 | 国立国語研究所 |