@inproceedings{oai:repository.ninjal.ac.jp:00003741, author = {平林, 照雄 and 古宮, 嘉那子 and 浅原, 正幸 and Hirabayashi, Teruo and Komiya, Kanako and Asahara, Masayuki}, book = {言語資源ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源ワークショップ2022, 開催地: オンライン, 会期: 2022年8月30日-31日, 主催: 国立国語研究所 言語資源開発センター, 科学論文では、しばしば「問題内容」と「解決法」が主題となる。我々は、日本語科学論文において「問題内容」と「解決法」のペアを効率的に取得するシステムの作成を目指している。Heffernanら(2018)は、“problem”及びその類義語に注目し、パターン抽出を用いて英語科学論文における「問題内容」提起箇所の抽出を行った。しかし、日本語は英語とは異なり、決まったパターンがないことから、単純なパターン抽出では「問題内容」を抽出することができない。そのため、本論文では、「問題」という語を含む文とそれらの前後文を少量用意し、それらに「問題内容」が含まれているかどうかのアノテーションを行う。また、それらのアノテーションデータを用いて機械学習を行い、大量のデータに適用することで、自己学習により「問題内容」の有無のタグを付与し、付与されたタグの精度を調査した。, application/pdf, 東京農工大学 生物システム応用科学府, 東京農工大学, 国立国語研究所, Tokyo University of Agriculture and Technology, Tokyo University of Agriculture and Technology, National Institute for Japanese Language and Linguistics}, pages = {59--69}, publisher = {国立国語研究所}, title = {科学技術論文における「問題」の周辺文からの問題内容の抽出}, volume = {1}, year = {2023} }