ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

{"_buckets": {"deposit": "65838edd-5c2c-4b66-a216-a13848fd23e4"}, "_deposit": {"created_by": 3, "id": "1531", "owners": [3], "pid": {"revision_id": 0, "type": "depid", "value": "1531"}, "status": "published"}, "_oai": {"id": "oai:repository.ninjal.ac.jp:00001531", "sets": ["246"]}, "author_link": ["5741", "5742"], "item_10003_biblio_info_32": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2017", "bibliographicIssueDateType": "Issued"}, "bibliographicPageEnd": "153", "bibliographicPageStart": "144", "bibliographicVolumeNumber": "2", "bibliographic_titles": [{"bibliographic_title": "言語資源活用ワークショップ発表論文集"}, {"bibliographic_title": "Proceedings of Language Resources Workshop", "bibliographic_titleLang": "en"}]}]}, "item_10003_description_27": {"attribute_name": "会議概要(会議名, 開催地, 会期, 主催者等)", "attribute_value_mlt": [{"subitem_description": "会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター", "subitem_description_type": "Other"}]}, "item_10003_description_29": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "国立国語研究所で構築している短単位自動解析用辞書『UniDic』は,現在,形態素解析器MeCab専用の解析用辞書として使用・公開を行なっている.しかし解析用UniDicで使用しているCRF素性テンプレートは,MeCab用の他の辞書(『IPA辞書』,『Juman辞書』)に比べ,行数が多く,学習後のモデルファイルのサイズ(素性数)も他より大きなものとなっている.そこで今回,現代語用の解析用『UniDic』のCRF素性テンプレートの再検討を行ない,より少メモリかつ,これまでとほぼ同等の性能の解析用辞書を実現した.", "subitem_description_type": "Abstract"}]}, "item_10003_description_43": {"attribute_name": "フォーマット", "attribute_value_mlt": [{"subitem_description": "application/pdf", "subitem_description_type": "Other"}]}, "item_10003_description_51": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_description": "国立国語研究所", "subitem_description_type": "Other"}]}, "item_10003_identifier_registration": {"attribute_name": "ID登録", "attribute_value_mlt": [{"subitem_identifier_reg_text": "10.15084/00001515", "subitem_identifier_reg_type": "JaLC"}]}, "item_10003_publisher_45": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "国立国語研究所"}]}, "item_10003_relation_40": {"attribute_name": "関連サイト", "attribute_value_mlt": [{"subitem_relation_name": [{"subitem_relation_name_text": "言語資源活用ワークショップ2017"}], "subitem_relation_type_id": {"subitem_relation_type_id_text": "http://pj.ninjal.ac.jp/corpus_center/lrw2017.html", "subitem_relation_type_select": "URI"}}]}, "item_10003_version_type_44": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "岡, 照晃"}, {"creatorName": "オカ, テルアキ", "creatorNameLang": "ja-Kana"}], "nameIdentifiers": [{"nameIdentifier": "5741", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "OKA, Teruaki", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "5742", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2019-02-15"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "LRW-2017-17-O-B-1.pdf", "filesize": [{"value": "555.3 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 555300.0, "url": {"label": "LRW-2017-17-O-B-1.pdf", "url": "https://repository.ninjal.ac.jp/record/1531/files/LRW-2017-17-O-B-1.pdf"}, "version_id": "2e51edfd-d00c-40d2-a6eb-b0f84f14dbd7"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "UniDic", "subitem_subject_scheme": "Other"}, {"subitem_subject": "現代日本語書き言葉均衡コーパス(BCCWJ)", "subitem_subject_scheme": "Other"}, {"subitem_subject": "日本語話し言葉コーパス(CSJ)", "subitem_subject_scheme": "Other"}, {"subitem_subject": "UniDic", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Balanced Corpus of Contemporary Written Japanese (BCCWJ)", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}, {"subitem_subject": "Corpus of Spontaneous Japanese (CSJ)", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "conference paper", "resourceuri": "http://purl.org/coar/resource_type/c_5794"}]}, "item_title": "CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic :  unidic-cwj-2.2.0とunidic-csj-2.2.0", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic :  unidic-cwj-2.2.0とunidic-csj-2.2.0"}]}, "item_type_id": "10003", "owner": "3", "path": ["246"], "permalink_uri": "https://doi.org/10.15084/00001515", "pubdate": {"attribute_name": "公開日", "attribute_value": "2018-03-20"}, "publish_date": "2018-03-20", "publish_status": "0", "recid": "1531", "relation": {}, "relation_version_is_last": true, "title": ["CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic :  unidic-cwj-2.2.0とunidic-csj-2.2.0"], "weko_shared_id": -1}
  1. 言語資源ワークショップ(旧:言語資源活用ワークショップ)
  2. 言語資源活用ワークショップ2017発表論文集

CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic : unidic-cwj-2.2.0とunidic-csj-2.2.0

https://doi.org/10.15084/00001515
https://doi.org/10.15084/00001515
f9ef655c-dd93-4258-ad40-6787789ae67e
名前 / ファイル ライセンス アクション
LRW-2017-17-O-B-1.pdf LRW-2017-17-O-B-1.pdf (555.3 kB)
Item type 会議発表論文 / Conference Paper(1)
公開日 2018-03-20
タイトル
タイトル CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic : unidic-cwj-2.2.0とunidic-csj-2.2.0
言語
言語 jpn
キーワード
主題Scheme Other
主題 UniDic
キーワード
主題Scheme Other
主題 現代日本語書き言葉均衡コーパス(BCCWJ)
キーワード
主題Scheme Other
主題 日本語話し言葉コーパス(CSJ)
キーワード
言語 en
主題Scheme Other
主題 UniDic
キーワード
言語 en
主題Scheme Other
主題 Balanced Corpus of Contemporary Written Japanese (BCCWJ)
キーワード
言語 en
主題Scheme Other
主題 Corpus of Spontaneous Japanese (CSJ)
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
ID登録
ID登録 10.15084/00001515
ID登録タイプ JaLC
著者 岡, 照晃

× 岡, 照晃

WEKO 5741

岡, 照晃

ja-Kana オカ, テルアキ

Search repository
OKA, Teruaki

× OKA, Teruaki

WEKO 5742

en OKA, Teruaki

Search repository
著者所属
内容記述タイプ Other
内容記述 国立国語研究所
会議概要(会議名, 開催地, 会期, 主催者等)
内容記述タイプ Other
内容記述 会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター
抄録
内容記述タイプ Abstract
内容記述 国立国語研究所で構築している短単位自動解析用辞書『UniDic』は,現在,形態素解析器MeCab専用の解析用辞書として使用・公開を行なっている.しかし解析用UniDicで使用しているCRF素性テンプレートは,MeCab用の他の辞書(『IPA辞書』,『Juman辞書』)に比べ,行数が多く,学習後のモデルファイルのサイズ(素性数)も他より大きなものとなっている.そこで今回,現代語用の解析用『UniDic』のCRF素性テンプレートの再検討を行ない,より少メモリかつ,これまでとほぼ同等の性能の解析用辞書を実現した.
書誌情報 言語資源活用ワークショップ発表論文集
en : Proceedings of Language Resources Workshop

巻 2, p. 144-153, 発行日 2017
関連サイト
識別子タイプ URI
関連識別子 http://pj.ninjal.ac.jp/corpus_center/lrw2017.html
関連名称 言語資源活用ワークショップ2017
フォーマット
内容記述タイプ Other
内容記述 application/pdf
著者版フラグ
出版タイプ VoR
出版タイプResource http://purl.org/coar/version/c_970fb48d4fbd8a85
出版者
出版者 国立国語研究所
戻る
0
views
See details
Views

Versions

Ver.1 2023-05-15 15:25:39.799731
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3