ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 国立国語研究所論集
  2. 第22号

全文検索システム『ひまわり』用『国会会議録』パッケージの構築

https://doi.org/10.15084/00003521
https://doi.org/10.15084/00003521
24c3996d-09a6-4578-afb8-160ca9c0d030
名前 / ファイル ライセンス アクション
papers2211.pdf papers2211.pdf (877.8 kB)
Item type 紀要論文 / Departmental Bulletin Paper(1)
公開日 2022-01-21
タイトル
タイトル 全文検索システム『ひまわり』用『国会会議録』パッケージの構築
タイトル
タイトル Construction of a Language Resource Package of the Minutes of the National Diet of Japan for the Full-Text Search System "Himawari"
言語 en
言語
言語 jpn
キーワード
主題Scheme Other
主題 国会会議録
キーワード
主題Scheme Other
主題 言語資料
キーワード
主題Scheme Other
主題 全文検索システム『ひまわり』
キーワード
主題Scheme Other
主題 経年変化分析
キーワード
言語 en
主題Scheme Other
主題 The Minutes of the National Diet of Japan
キーワード
言語 en
主題Scheme Other
主題 language resource
キーワード
言語 en
主題Scheme Other
主題 full-text search system "Himawari"
キーワード
言語 en
主題Scheme Other
主題 temporal change analysis
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ departmental bulletin paper
ID登録
ID登録 10.15084/00003521
ID登録タイプ JaLC
著者 山口, 昌也

× 山口, 昌也

WEKO 11804

山口, 昌也

Search repository
YAMAGUCHI, Masaya

× YAMAGUCHI, Masaya

WEKO 11805

en YAMAGUCHI, Masaya

Search repository
著者所属
内容記述タイプ Other
内容記述 国立国語研究所 研究系 音声言語研究領域
著者所属(英)
内容記述タイプ Other
内容記述 Spoken Language Division, Research Department, NINJAL
抄録
内容記述タイプ Abstract
内容記述 本稿は,『国会会議録検索システム』に収録されている国会会議録のテキストデータに基づき,全文検索システム『ひまわり』用の『国会会議録』パッケージを構築する方法,および,構築結果を報告する。本パッケージには,1947(第1回)~ 2012年(第182回)に開催された衆議院・参議院の本会議,および,予算委員会の会議録11106件(約4.49億字)を収録している。本パッケージは言語表現の経年変化分析を行うために設計され,会議情報,発言者情報,会議録の構造情報がXMLで付与されている。本稿では,まず,XMLタグを設計するとともに,原資料の表記上の手がかりを使って,設計したタグを会議録に自動的にアノテーションする方法を示す。次に,考案した手法に基づいて『国会会議録』パッケージを構築する。また,構築したパッケージに収録した会議録の基礎情報を示す。最後に,『国会会議録』パッケージを使って,(a)経年変化が大きい表現を抽出する方法,(b)抽出された表現に対する経年変化要因を調査する方法を示すことにより,『国会会議録』パッケージの有用性を示す。
抄録(英)
内容記述タイプ Other
内容記述 This paper presents the method whereby a language resource package of the Minutes of the National Diet of Japan was constructed for the Full-Text Search System "Himawari" from text data stored in the Full-Text Database System for the Minutes of the Diet and reports the results of the construction. This package includes 11106 minutes (about 450 million characters) of the 1st (1947) to 182nd (2012) plenary sessions and budget committee meetings in the House of Representatives and the House of Councillors. Information related to the meetings, speakers, and the document structures of the minutes are annotated to the minutes in XML to facilitate the analysis of temporal changes in linguistic expressions. In this paper, I first describe the XML tags and an automatic annotation method created using notational clues in the minutes, then I detailed the application of the annotation method to the original minute data to construct the package and summarized the results. Finally, this paper classifies the usefulness of the package by showing how it can be used (a) to extract expressions showing large temporal changes and (b) to investigate the factors of the changes.
出版者
出版者 国立国語研究所
書誌情報 国立国語研究所論集
en : NINJAL Research Papers

号 22, p. 177-195, 発行日 2022-01
ISSN
収録物識別子タイプ ISSN
収録物識別子 2186-1358
フォーマット
内容記述タイプ Other
内容記述 application/pdf
著者版フラグ
出版タイプ VoR
出版タイプResource http://purl.org/coar/version/c_970fb48d4fbd8a85
戻る
0
views
See details
Views

Versions

Ver.1 2023-05-15 14:44:47.107014
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR 2.0
  • OAI-PMH JPCOAR 1.0
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3