WEKO3
アイテム
{"_buckets": {"deposit": "b5fb291f-9bac-481b-bbf4-2f77b76bed53"}, "_deposit": {"created_by": 3, "id": "3740", "owners": [3], "pid": {"revision_id": 0, "type": "depid", "value": "3740"}, "status": "published"}, "_oai": {"id": "oai:repository.ninjal.ac.jp:00003740", "sets": ["540"]}, "author_link": ["12450", "12453", "12452", "12451"], "item_10003_biblio_info_32": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2023", "bibliographicIssueDateType": "Issued"}, "bibliographicPageEnd": "58", "bibliographicPageStart": "53", "bibliographicVolumeNumber": "1", "bibliographic_titles": [{"bibliographic_title": "言語資源ワークショップ発表論文集"}, {"bibliographic_title": "Proceedings of Language Resources Workshop", "bibliographic_titleLang": "en"}]}]}, "item_10003_description_27": {"attribute_name": "会議概要(会議名, 開催地, 会期, 主催者等)", "attribute_value_mlt": [{"subitem_description": "会議名: 言語資源ワークショップ2022, 開催地: オンライン, 会期: 2022年8月30日-31日, 主催: 国立国語研究所 言語資源開発センター", "subitem_description_type": "Other"}]}, "item_10003_description_29": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "『日本語会話話題別コーパス:J-TOCC』の語彙表を公開する。表は2種類で、15ある話題間での特徴度を比較するための粗頻度ならびにLLRの表と、各話題ごとに、240名の調査協力者がそれぞれ何度その語を使用したかというデータを収めた表である。前者の表はどの話題に特徴的かという偏りを表し、後者の表は、ある話題を与えられた時に母語話者の何%がその語を使用するかという「使用者割合」を取り出せる。本プロジェクトの最終目標は日本語教育に役立つ「話題—語彙情報サイト」の構築であるが、現場に役立つ形で情報を整理するにはこの2種類の情報が必要であることを主張する。語の使用者の幅を見る指標としてはtf-idfなども存在するが、検討の結果、本データでは使用総頻度の影響が大きすぎることがわかった。一方で、LLRは語の特徴語を効率よく抽出できるが、多義語など、他の話題の影響で値が低くなることもある。使用者割合はその点をカバーすることができる。", "subitem_description_type": "Abstract"}]}, "item_10003_description_43": {"attribute_name": "フォーマット", "attribute_value_mlt": [{"subitem_description": "application/pdf", "subitem_description_type": "Other"}]}, "item_10003_description_51": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_description": "大阪大学国際教育交流センター", "subitem_description_type": "Other"}, {"subitem_description": "関西大学国際教育センター", "subitem_description_type": "Other"}]}, "item_10003_description_52": {"attribute_name": "著者所属(英)", "attribute_value_mlt": [{"subitem_description": "Osaka University", "subitem_description_type": "Other"}, {"subitem_description": "Kansai University", "subitem_description_type": "Other"}]}, "item_10003_identifier_registration": {"attribute_name": "ID登録", "attribute_value_mlt": [{"subitem_identifier_reg_text": "10.15084/00003723", "subitem_identifier_reg_type": "JaLC"}]}, "item_10003_publisher_45": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "国立国語研究所"}]}, "item_10003_relation_40": {"attribute_name": "関連サイト", "attribute_value_mlt": [{"subitem_relation_name": [{"subitem_relation_name_text": "言語資源ワークショップ2022"}], "subitem_relation_type_id": {"subitem_relation_type_id_text": "https://clrd.ninjal.ac.jp/lrw2022.html", "subitem_relation_type_select": "URI"}}]}, "item_10003_version_type_44": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "中俣, 尚己"}], "nameIdentifiers": [{"nameIdentifier": "12450", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "麻, 子軒"}], "nameIdentifiers": [{"nameIdentifier": "12451", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "NAKAMATA, Naoki", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "12452", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "MA, Tzuhsuan", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "12453", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2023-03-23"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "LRW2022_07-p1-4.pdf", "filesize": [{"value": "488.7 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 488700.0, "url": {"label": "LRW2022_07-p1-4.pdf", "url": "https://repository.ninjal.ac.jp/record/3740/files/LRW2022_07-p1-4.pdf"}, "version_id": "b1eca2f8-90f9-41e8-bfaa-1de2f3a5ff0f"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "conference paper", "resourceuri": "http://purl.org/coar/resource_type/c_5794"}]}, "item_title": "『日本語話題別会話コーパス:J TOCC 語彙表』の公開と日本語教育むけ情報サイトにむけた指標の検討", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "『日本語話題別会話コーパス:J TOCC 語彙表』の公開と日本語教育むけ情報サイトにむけた指標の検討"}, {"subitem_title": "‘Vocabulary Table of Japanese Topic O riented Conversation Corpus’ and a Consideration of Indices for Japanese Language Teaching", "subitem_title_language": "en"}]}, "item_type_id": "10003", "owner": "3", "path": ["540"], "permalink_uri": "https://doi.org/10.15084/00003723", "pubdate": {"attribute_name": "公開日", "attribute_value": "2023-03-24"}, "publish_date": "2023-03-24", "publish_status": "0", "recid": "3740", "relation": {}, "relation_version_is_last": true, "title": ["『日本語話題別会話コーパス:J TOCC 語彙表』の公開と日本語教育むけ情報サイトにむけた指標の検討"], "weko_shared_id": 3}
『日本語話題別会話コーパス:J TOCC 語彙表』の公開と日本語教育むけ情報サイトにむけた指標の検討
https://doi.org/10.15084/00003723
https://doi.org/10.15084/00003723d505be86-5184-4082-a618-5c16012a9883
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | 会議発表論文 / Conference Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2023-03-24 | |||||
タイトル | ||||||
タイトル | 『日本語話題別会話コーパス:J TOCC 語彙表』の公開と日本語教育むけ情報サイトにむけた指標の検討 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | ‘Vocabulary Table of Japanese Topic O riented Conversation Corpus’ and a Consideration of Indices for Japanese Language Teaching | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00003723 | |||||
ID登録タイプ | JaLC | |||||
著者 |
中俣, 尚己
× 中俣, 尚己× 麻, 子軒× NAKAMATA, Naoki× MA, Tzuhsuan |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 大阪大学国際教育交流センター | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 関西大学国際教育センター | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Osaka University | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Kansai University | |||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||
内容記述タイプ | Other | |||||
内容記述 | 会議名: 言語資源ワークショップ2022, 開催地: オンライン, 会期: 2022年8月30日-31日, 主催: 国立国語研究所 言語資源開発センター | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 『日本語会話話題別コーパス:J-TOCC』の語彙表を公開する。表は2種類で、15ある話題間での特徴度を比較するための粗頻度ならびにLLRの表と、各話題ごとに、240名の調査協力者がそれぞれ何度その語を使用したかというデータを収めた表である。前者の表はどの話題に特徴的かという偏りを表し、後者の表は、ある話題を与えられた時に母語話者の何%がその語を使用するかという「使用者割合」を取り出せる。本プロジェクトの最終目標は日本語教育に役立つ「話題—語彙情報サイト」の構築であるが、現場に役立つ形で情報を整理するにはこの2種類の情報が必要であることを主張する。語の使用者の幅を見る指標としてはtf-idfなども存在するが、検討の結果、本データでは使用総頻度の影響が大きすぎることがわかった。一方で、LLRは語の特徴語を効率よく抽出できるが、多義語など、他の話題の影響で値が低くなることもある。使用者割合はその点をカバーすることができる。 | |||||
書誌情報 |
言語資源ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 1, p. 53-58, 発行日 2023 |
|||||
関連サイト | ||||||
識別子タイプ | URI | |||||
関連識別子 | https://clrd.ninjal.ac.jp/lrw2022.html | |||||
関連名称 | 言語資源ワークショップ2022 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
出版者 | ||||||
出版者 | 国立国語研究所 |