WEKO3
アイテム
国語辞典編集のための用例データベース
https://doi.org/10.15084/00002011
https://doi.org/10.15084/000020111ea344e2-716e-4b0c-a62c-86d78af0c88e
名前 / ファイル | ライセンス | アクション |
---|---|---|
kk_ngkgk_005_06.pdf (1.4 MB)
|
|
Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2019-03-25 | |||||
タイトル | ||||||
タイトル | 国語辞典編集のための用例データベース | |||||
タイトル | ||||||
タイトル | "Yoorei database" for dictionary compilation | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 用例データベース | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 辞書 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | コンコーダンス | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | コーパス | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | KWIC | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | yoorei database | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | dictionary | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | concordance | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | corpus | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | KWIC | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | departmental bulletin paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00002011 | |||||
ID登録タイプ | JaLC | |||||
著者 |
木村, 睦子
× 木村, 睦子× 加藤, 安彦× 田中, 牧郎× KIMURA, Mutsuko× KATO, Yasuhiko× TANAKA, Makiro |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | The National Language Research Institute | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | The National Language Research Institute | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | The National Language Research Institute | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 既存の辞書に依存しないオリジナルな辞書を作るためには,まず生の用例をたくさん集める必要がある。国立国語研究所国語辞典編集室では,昭和54年に準備室が発足して以来,用例採集のための目録作り,作業手順の検討などを行うとともに,国定読本を資料として試験的に用例採集作業を開始した。昭和63年に正式の室になってからは,雑誌を対象に本格的な用例採集を開始し,続いて文学作品・国定算数教科書などに手をつけた。当面対象とする年代は,1901~1950年であるが,いずれは範囲を広げる予定である。国定読本についてはすでにコンコーダンスが完成し,『国定読本用語総覧』1~12及びCD-ROMを刊行した(三省堂)。国定算数教科書についてもKWICと語彙表ができており,インターネット上での公開を考えている。現在最も力を注いでいるのが総合雑誌『太陽』であるが,これも3,4年のうちに,電子媒体で出版することになるだろう。文学作品については,多数の作家にわたるよう,短い作品をえらんで作業を進めている。 | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | We are building a "yoorei database" (assembled concordances) for the purpose of compiling an original dictionary that is not dependent upon existing dictionaries. We assume that standard Japanese was established between 1901 and 1950. We set this period as our starting point to build our "yoorei database". In order to cover a wide range of our database objects, we take into consideration such materials as school textbooks, newspapers, magazines, literary works, best selling books, and the Diet Record. Three sets of materials that have already been worked on follow. 1. Japanese school textbooks written by the Ministry of Education (Completed) "Kokutei Tokuhon Yoogo Sooran" (A concordance of Kokutei Tokuhon) vol. 1-12 and CD-ROM version. Total number of words: 600,000 Total number of different words: 32,000 These numbers were counted by the "zensuu-shiki" method (to make a concordance of whole words from a data set). 2. Popular magazine "Taiyoo" 62 volumes (In progress. Planned to be done within 3-4 years.) Total number of words: 550,000 by the "scout-shiki" method (to make a concordance of selected words by "scout standard" from a data set). We are inputting the text data of the entire 62 volumes in order to provide contexts for the materials. We estimate that this text data set will consist of 8,000,000 characters. 3. Literary works: 334 stories (In progress) We chose 334 various short stories (including novels, essays, critical essays, drama and juvenile stories) from the point of view of creating a well-balanced concordance. We estimate the total number of words at 1,700,000, excluding postpositional particles and auxiliary verbs. 4. Arithmetic school textbooks written by the Ministry of Education (Completed) KWIC (Key Word In Context) data and the lexicon from this material have already been done. (Unpublished) Total number of words: 200,000 Total number of different words: 6,600 We have tentatively tried different methods for each data set. At this point, however, we are planning to make a manual (for building the "yoorei database") more complete in order to build the database using the most effective methods. | |||||
出版者 | ||||||
出版者 | 国立国語研究所 | |||||
書誌情報 |
日本語科学 en : Japanese Linguistics 巻 5, p. 109-128, 発行日 1999-04 |
|||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |