@article{oai:repository.ninjal.ac.jp:00003079, author = {田島, 孝治 and 堤, 智昭 and 高田, 智和 and Tajima, Koji and Tsutsumi, Tomoaki and Takada, Tomokazu}, issue = {2}, journal = {情報処理学会論文誌}, month = {Feb}, note = {岐阜工業高等専門学校, 筑波大学, 国立国語研究所, National Institute of Technology, Gifu College, University of Tsukuba, National Institute for Japanese Language and Linguistics, This paper describes quantitative analysis of the gloss in the Kunten Materials. It aims at an automatic interpreted text generation. For a description the Kunten Materials, we developed the Iten tool and constructed a data of gloss in the “Shangshu” (old type print version). This constructed data is suitable for the quantitative analysis with computer. We analyzed the reading order of the multi wokototen marks on a character using the data. Define the reading order of wokototen marks is important to generate the interpreted text. For example, a character has 3 kinds of wokoten these shows "シ", "テ", "ニ". In this case, the reading order is "ニシテ". We need to identify the general patterns that can appear in the documents, and define the reading order for these patterns. We checked every combination pattern of the wokototen marks in this document. There are 121 combination patterns, and we fixed the order. In addition, we extract the wokototen marks that show how to read the Chinese character., 本論文では,訓点資料の書き下し文を自動生成することを目的とし,書き下し文を自動生成するうえで問題となる,1つの漢字に複数のヲコト点が付与されている場合の分析を行い,ヲコト点の読み順が定まるかを検証した.ヲコト点は記号訓点の一種で,漢字に付された位置と形状により読みは定まるが,ヲコト点が複数あった場合,順番は定まらない.たとえば「シ」,「テ」,「ニ」と3つのヲコト点がついていた場合に「ニシテ」と順を定めて書き下すためには,読み順の定義が必要である.対象とした資料(国立国語研究所蔵『尚書(古活字版)』)には121種類,のべ672個のヲコト点の組合せが登場するが,いずれも読み順が一意に定まることが確認できた.また,漢字の読み仮名の一部を表す場合のみに使われるヲコト点も抽出することができた.}, pages = {162--170}, title = {訓点資料の書き下し文自動生成を目的としたヲコト点を中心とする訓点の計量分析}, volume = {61}, year = {2020}, yomi = {タジマ, コウジ and ツツミ, トモアキ and タカダ, トモカズ} }