@inproceedings{oai:repository.ninjal.ac.jp:00003318, author = {加藤, 安彦}, book = {国立国語研究所創立50周年記念 研究発表会資料集 : 歩こう日本語の世界を}, month = {Dec}, note = {開催地:国立国語研究所 会期:平成10年12月14日(月)-15日(火), ここでは、現在用例採集作業が進行中の1901年~1950年までの50年間における雑誌『太陽』及び文学作品のデータに対して考えている単位の付与のしかたについて述べる。 ここでの単位とは、 ○用例を収集してデータベース化した時点で検索などにおいて表面的に現れる語 ○用例データベースから欲しい用例を検索・抽出するきっかけとなるキーワード などを考える上で必要とされるもので、「個々の語の機能や意味などの情報を担う用例データベースでの最小のかたまり」といった意味である。 今後の用例採集においてどのような長さ・種類の単位を考えていくべきか、その情報をどのようにデータベース上に格納していくべきかについて述べる。なお、この用例データベースは将来的にデータ量を拡大していき、その情報をもとにコーパス化することを考えているもので、その意味でも単位についてゆらぎの少ない規準作りが必要となってくる。 また、最後にこうして作成された用例集をどのように利用していくか、その簡単な例を挙げる。例として使用するのは、既に用例採集作業を終えた第一期から第六期までの国定読本データで、これには冊子体の他、CD-ROM版でも公刊されているので、そのCD-ROM版によって説明を行う。, application/pdf, 国立国語研究所}, pages = {47--54}, publisher = {国立国語研究所創立50周年記念事業実施委員会}, title = {用例データベース作成のための単位と用例データベースの使い方}, year = {1998} }