@article{oai:repository.ninjal.ac.jp:00001159, author = {木村, 睦子 and 山田, 雅一 and KIMURA, Mutuko and YAMADA, Masakazu}, journal = {研究報告集, Occasional Papers}, month = {Mar}, note = {国立国語研究所, 国立国語研究所, 辞書に収録される各見出し語が,その言語体系の中でどの程度の汎用牲・重要性を持つかを5~7段階ぐらいの段階区分で示したい。用途によっては見出し語数が少ない方がよい場合もあるので,大きな辞書から部分集合を機械的に取りだすための手掛かりを与えるのが目的である。変数として用いるのは,語の使用頻度と使用範囲の二つだけであるが,それでも関数の形によって見出し語の重要度の順位に違いが生ずる。計算結果を人間の目で見,分析して,関数に評価を与えようとするものである。ここで取り上げる関数は三つで,そのうち二つは主題分野別(層別)頻度を用いるもの,他の一つは文献ごとの頻度を用いるものである。データとしては,国立国語研究所の語彙調査や索引作成で得た数値を用いた。, It is desired to give each head word in a lexicon a feature which indicates its indispensibility,i.e. the generality and importance of the word in the language system, to make it possible for someone to pick out automatically a subset of the lexicon according to his purpose. Three functions were prepared and tested to compute the indispensibilities of words. Two of them have as their variables total freqency and an index of dispersion based on whether the word occurs in many subject fields evenly or concentrates in one field. The third offers a way of calculation for statistical data which have no subject categories, using instead frequencies of words in each document. Rank lists were made on the basis of the function values, and the results were evaluated by human judgement., application/pdf, 17の書名 : 国立国語研究所研究報告集}, pages = {1--34}, title = {基本度関数について}, volume = {15}, year = {1994}, yomi = {キムラ, ムツコ and ヤマダ, マサカズ} }