@article{oai:repository.ninjal.ac.jp:00003538, author = {山口, 昌也 and YAMAGUCHI, Masaya}, issue = {22}, journal = {国立国語研究所論集, NINJAL Research Papers}, month = {Jan}, note = {国立国語研究所 研究系 音声言語研究領域, Spoken Language Division, Research Department, NINJAL, 本稿は,『国会会議録検索システム』に収録されている国会会議録のテキストデータに基づき,全文検索システム『ひまわり』用の『国会会議録』パッケージを構築する方法,および,構築結果を報告する。本パッケージには,1947(第1回)~ 2012年(第182回)に開催された衆議院・参議院の本会議,および,予算委員会の会議録11106件(約4.49億字)を収録している。本パッケージは言語表現の経年変化分析を行うために設計され,会議情報,発言者情報,会議録の構造情報がXMLで付与されている。本稿では,まず,XMLタグを設計するとともに,原資料の表記上の手がかりを使って,設計したタグを会議録に自動的にアノテーションする方法を示す。次に,考案した手法に基づいて『国会会議録』パッケージを構築する。また,構築したパッケージに収録した会議録の基礎情報を示す。最後に,『国会会議録』パッケージを使って,(a)経年変化が大きい表現を抽出する方法,(b)抽出された表現に対する経年変化要因を調査する方法を示すことにより,『国会会議録』パッケージの有用性を示す。, This paper presents the method whereby a language resource package of the Minutes of the National Diet of Japan was constructed for the Full-Text Search System "Himawari" from text data stored in the Full-Text Database System for the Minutes of the Diet and reports the results of the construction. This package includes 11106 minutes (about 450 million characters) of the 1st (1947) to 182nd (2012) plenary sessions and budget committee meetings in the House of Representatives and the House of Councillors. Information related to the meetings, speakers, and the document structures of the minutes are annotated to the minutes in XML to facilitate the analysis of temporal changes in linguistic expressions. In this paper, I first describe the XML tags and an automatic annotation method created using notational clues in the minutes, then I detailed the application of the annotation method to the original minute data to construct the package and summarized the results. Finally, this paper classifies the usefulness of the package by showing how it can be used (a) to extract expressions showing large temporal changes and (b) to investigate the factors of the changes., application/pdf}, pages = {177--195}, title = {全文検索システム『ひまわり』用『国会会議録』パッケージの構築}, year = {2022} }