@inproceedings{oai:repository.ninjal.ac.jp:00001531, author = {岡, 照晃 and OKA, Teruaki}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター, 国立国語研究所で構築している短単位自動解析用辞書『UniDic』は,現在,形態素解析器MeCab専用の解析用辞書として使用・公開を行なっている.しかし解析用UniDicで使用しているCRF素性テンプレートは,MeCab用の他の辞書(『IPA辞書』,『Juman辞書』)に比べ,行数が多く,学習後のモデルファイルのサイズ(素性数)も他より大きなものとなっている.そこで今回,現代語用の解析用『UniDic』のCRF素性テンプレートの再検討を行ない,より少メモリかつ,これまでとほぼ同等の性能の解析用辞書を実現した., application/pdf, 国立国語研究所}, pages = {144--153}, publisher = {国立国語研究所}, title = {CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic : unidic-cwj-2.2.0とunidic-csj-2.2.0}, volume = {2}, year = {2017}, yomi = {オカ, テルアキ} }