@inproceedings{oai:repository.ninjal.ac.jp:00002585, author = {岡, 照晃 and Oka, Teruaki}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター, 本発表では、形態素解析器『MeCab』用の電子化辞書である短単位自動解析用辞書『UniDic』(『解析用UniDic』)のアペンドデータの公開について紹介を行う。『UniDic』は『MeCab』用の辞書の配布という外部公開形式をとっているが、v2.2からその解析結果中に各短単位のID情報を出力するようになった。この情報を使えば、所外の研究者が自ら拡張した新たなカラムの情報を『UniDic』短単位にひも付く形で配布することができ、研究者間での共有も可能になる。本発表では、短単位のID情報について詳説し、それにひも付け、公開を行なっているアペンドデータ『UniDic非コアデータ』を紹介する。, application/pdf, 国立国語研究所, National Institute for Japanese Language and Linguistics}, pages = {185--194}, publisher = {国立国語研究所}, title = {UniDic非コアデータ : 解析用UniDicのID情報にひも付く追加情報の公開について}, volume = {4}, year = {2019}, yomi = {オカ, テルアキ} }