@inproceedings{oai:repository.ninjal.ac.jp:00001536, author = {近藤, 泰弘 and KONDO, Yasuhiro}, book = {言語資源活用ワークショップ発表論文集, Proceedings of Language Resources Workshop}, month = {}, note = {会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター, 日本語歴史コーパスは,中納言のインターフェースで公開されているが,XML形式の本体の全体を解析することで,より多くの情報を引き出すことができる。今回は,『源氏物語』の全文を対象に,短単位および長単位およびN-gramによる分割を施し,それぞれをコンコーダンス形式に出力した。また,それらを,既存のコンコーダンスである北山谿太編『源氏物語辞典』(平凡社・と比較対照することによって,コーパスを利用したコンコーダンスのメリット・デメリットを検証した。また,総語彙やセンテンスを各種の機械学習モデルによって分析し,『源氏物語』における語彙とトピックの分布の関係ついての知見を得ることができた。, application/pdf, 青山学院大学}, pages = {204--211}, publisher = {国立国語研究所}, title = {『源氏物語』コンコーダンスとその応用}, volume = {2}, year = {2017}, yomi = {コンドウ, ヤスヒロ} }