@inproceedings{oai:repository.ninjal.ac.jp:00003182, author = {堀, 一成 and Hori, Kazunari and 坂尻, 彰宏 and Sakajiri, Akihiro}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター, 大学学部初年次生向け科学技術系日本語アカデミック・ライティング指導教材を作成する際の基礎データとするため、学術文・技術文の長単位による形態素解析を行い、用いられている(基本語彙を除く)一般動詞の頻度情報を得た。長単位形態素解析に用いたソフトウェアは、小澤俊介氏らの開発したComainu-0.72 を採用した。学術文の代表として、大阪大学に提出された理学・工学・医学・薬学などの日本語博士学位論文の本文(107件でデータ量は、全角文字数で約450万字)を、技術文の代表として、大阪産業技術研究所が公開している技術報告文(486文書、データ量全角文字数で約35 万字) を、解析の対象として選定した。より専門的な語彙を抽出するため、国立国語研究所の国語研教育基本語彙のうち、特に基本的とされる2000語に含まれる動詞を除く処理も行った。本報告では、研究の背景、ソフトウェア実行手順、得られた成果に対する考察などを紹介する。, application/pdf, 大阪大学, 大阪大学, Osaka University, Osaka University}, pages = {267--273}, publisher = {国立国語研究所}, title = {科学技術系ライティング教材作成のためのComainuを利用した日本語学術文技術文長単位解析}, volume = {5}, year = {2020}, yomi = {ホリ, カズナリ and サカジリ, アキヒロ} }