@inproceedings{oai:repository.ninjal.ac.jp:00001502, author = {山崎, 誠 and YAMAZAKI, Makoto}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター, 「政財界」「国内外」などの漢字 3 字で構成される「略熟語」と呼ばれる形式は,先行研究が少なく実態が明らかでない。国語辞書にも掲載されることが少ない。本発表では,現代日本語にはどのような略熟語が存在するかを『現代日本語書き言葉均衡コーパス』(以下,BCCWJ)と『分類語彙表』を使って自動的に抽出することを試みた。具体的には,BCCWJから,前後が非漢字という条件で漢字 3 文字連続を抜き出し,それらを構成する漢語の頻度および分類語彙表における意味番号を付与したデータを作成した。そこから,出現頻度が一定以上で,構成要素となる漢語の分類番号が一致するものとして 874 語を抽出した。内訳は「政財界」タイプ 656 語,「国内外」タイプ 297 語,重複が 79 語であった。目視で確認したところ,抽出された 3 字漢語には,略熟語でないものも多く,精度を高めるにはさらに別の条件が必要であることが分かった., application/pdf, 国立国語研究所}, pages = {307--316}, publisher = {国立国語研究所}, title = {『現代日本語書き言葉均衡コーパス』と『分類語彙表』を利用した漢字3文字略熟語の抽出}, volume = {1}, year = {2017}, yomi = {ヤマザキ, マコト} }