@inproceedings{oai:repository.ninjal.ac.jp:00003740, author = {中俣, 尚己 and 麻, 子軒 and NAKAMATA, Naoki and MA, Tzuhsuan}, book = {言語資源ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源ワークショップ2022, 開催地: オンライン, 会期: 2022年8月30日-31日, 主催: 国立国語研究所 言語資源開発センター, 『日本語会話話題別コーパス:J-TOCC』の語彙表を公開する。表は2種類で、15ある話題間での特徴度を比較するための粗頻度ならびにLLRの表と、各話題ごとに、240名の調査協力者がそれぞれ何度その語を使用したかというデータを収めた表である。前者の表はどの話題に特徴的かという偏りを表し、後者の表は、ある話題を与えられた時に母語話者の何%がその語を使用するかという「使用者割合」を取り出せる。本プロジェクトの最終目標は日本語教育に役立つ「話題—語彙情報サイト」の構築であるが、現場に役立つ形で情報を整理するにはこの2種類の情報が必要であることを主張する。語の使用者の幅を見る指標としてはtf-idfなども存在するが、検討の結果、本データでは使用総頻度の影響が大きすぎることがわかった。一方で、LLRは語の特徴語を効率よく抽出できるが、多義語など、他の話題の影響で値が低くなることもある。使用者割合はその点をカバーすることができる。, application/pdf, 大阪大学国際教育交流センター, 関西大学国際教育センター, Osaka University, Kansai University}, pages = {53--58}, publisher = {国立国語研究所}, title = {『日本語話題別会話コーパス:J TOCC 語彙表』の公開と日本語教育むけ情報サイトにむけた指標の検討}, volume = {1}, year = {2023} }