@inproceedings{oai:repository.ninjal.ac.jp:00001535, author = {窪田, 悠介 and KUBOTA, Yusuke}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター, 国語研NPCMJコーパスは,(ゼロ代名詞や関係節空所などを含む) きめ細かな統語構造を付与したツリーバンクとして日本初のものであり,特に統語論や意味論など,今までコーパス利用があまりなされてこなかった分野でのコーパス活用を活性化させることが期待できる。一方で,木構造を検索し,そこから必要な情報を取り出す作業の (一見したところの) 複雑さのため,言語研究への活用は未だ模索段階を出ていない。本発表では,UNIX系OSでの基本スキルである単純なコマンドを数珠つなぎにしてデータを加工する手法と,ツリー検索・加工に特化されたスクリプト言語の合わせ技によって,NPCMJを用いて実際の言語研究に役立つ情報抽出が可能になることを示す。「(ガ/ノ交替の) ノ格でマークされた主語と共起する述語の頻度表を作る」というタスクを例に,コーパスからの情報抽出の具体的な手順を説明する。, application/pdf, 筑波大学}, pages = {192--203}, publisher = {国立国語研究所}, title = {ツリーバンク検索への「UNIX的」アプローチ}, volume = {2}, year = {2017}, yomi = {クボタ, ユウスケ} }