<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-03-08T14:10:06Z</responseDate>
  <request identifier="oai:repository.ninjal.ac.jp:00003514" metadataPrefix="jpcoar_1.0" verb="GetRecord">https://repository.ninjal.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:repository.ninjal.ac.jp:00003514</identifier>
        <datestamp>2023-05-15T14:52:47Z</datestamp>
        <setSpec>245:516</setSpec>
      </header>
      <metadata>
        <jpcoar:jpcoar xmlns:datacite="https://schema.datacite.org/meta/kernel-4/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcndl="http://ndl.go.jp/dcndl/terms/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:jpcoar="https://github.com/JPCOAR/schema/blob/master/1.0/" xmlns:oaire="http://namespace.openaire.eu/schema/oaire/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rioxxterms="http://www.rioxx.net/schema/v2.0/rioxxterms/" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns="https://github.com/JPCOAR/schema/blob/master/1.0/" xsi:schemaLocation="https://github.com/JPCOAR/schema/blob/master/1.0/jpcoar_scm.xsd">
          <dc:title>『日本語日常会話コーパス』での形態素解析：誤解析箇所の分析</dc:title>
          <dc:title xml:lang="en">Morphological Analysis of the Corpus of Everyday Japanese Conversation : An error analysis</dc:title>
          <jpcoar:creator>
            <jpcoar:creatorName>渡邊, 友香</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="ja-Kana">ワタナベ, ユカ</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:nameIdentifier nameIdentifierURI="https://nrid.nii.ac.jp/ja/nrid/1000050780516" nameIdentifierScheme="e-Rad">50780516</jpcoar:nameIdentifier>
            <jpcoar:creatorName>西川, 賢哉</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="ja-Kana">ニシカワ, ケンヤ</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="en">NISHIKAWA, Ken'ya</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName xml:lang="en">WATANABE, Yuka</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:subject subjectScheme="Other">UniDic</jpcoar:subject>
          <jpcoar:subject subjectScheme="Other">日本語日常会話コーパス(CEJC)</jpcoar:subject>
          <jpcoar:subject xml:lang="en" subjectScheme="Other">UniDic</jpcoar:subject>
          <jpcoar:subject xml:lang="en" subjectScheme="Other">Corpus of Everyday Japanese Conversation (CEJC)</jpcoar:subject>
          <datacite:description descriptionType="Other">会議名: 言語資源活用ワークショップ2021, 開催地: オンライン, 会期: 2021年9月13日-14日, 主催: 国立国語研究所 コーパス開発センター</datacite:description>
          <datacite:description descriptionType="Abstract">『日本語日常会話コーパス』(CEJC)の短単位情報付与作業では、次の4段階の作業工程、(i)転記をMeCab（解析器）+UniDic（解析辞書）で自動解析、(ii)音声を聴取しながら、付加情報の一つである「発音形」のみを人手修正、(iii)人手修正された発音形を尊重しつつ再び自動解析、(iv)短単位情報（境界情報、発音形以外の付加情報）を人手修正、を踏んでいる。今後の(iv)人手修正作業の参考とするため、人手修正済みデータを対象に、複数の版の現代話し言葉UniDic(Ver2.2.0, 2.3.0, 3.0.1, 3.1.0)を用いて(i)-(iii)を自動で実施し、その出力と人手修正結果とを比較した。その結果、UniDicの版が新しくなるにつれて誤解析の頻度が低下し、向上が見られたものの、誤りやすい個所がなお残っていることがわかった。特に、品詞が 「記号」「代名詞」「接続詞」「名詞-助動詞語幹」「名詞-固有名詞-人名-一般」「名詞-固有名詞-一般」となるべき語は、UniDicの版が新しくなっても別の品詞として解析される、短単位境界を誤るなど、誤解析が起こりやすい。</datacite:description>
          <datacite:description descriptionType="Other">application/pdf</datacite:description>
          <datacite:description descriptionType="Other">国立国語研究所</datacite:description>
          <datacite:description descriptionType="Other">国立国語研究所</datacite:description>
          <datacite:description descriptionType="Other">National Institute for Japanese Language and Linguistics</datacite:description>
          <datacite:description descriptionType="Other">National Institute for Japanese Language and Linguistics</datacite:description>
          <dc:publisher>国立国語研究所</dc:publisher>
          <datacite:date dateType="Issued">2021</datacite:date>
          <dc:language>jpn</dc:language>
          <dc:type rdf:resource="http://purl.org/coar/resource_type/c_5794">conference paper</dc:type>
          <oaire:version rdf:resource="http://purl.org/coar/version/c_970fb48d4fbd8a85">VoR</oaire:version>
          <jpcoar:identifier identifierType="DOI">https://doi.org/10.15084/00003497</jpcoar:identifier>
          <jpcoar:identifier identifierType="URI">https://repository.ninjal.ac.jp/records/3514</jpcoar:identifier>
          <jpcoar:identifierRegistration identifierType="JaLC">10.15084/00003497</jpcoar:identifierRegistration>
          <jpcoar:relation>
            <jpcoar:relatedIdentifier identifierType="URI">https://ccd.ninjal.ac.jp/lrw2021.html</jpcoar:relatedIdentifier>
            <jpcoar:relatedTitle>言語資源活用ワークショップ2021</jpcoar:relatedTitle>
          </jpcoar:relation>
          <jpcoar:sourceTitle>言語資源活用ワークショップ発表論文集</jpcoar:sourceTitle>
          <jpcoar:sourceTitle xml:lang="en">Proceedings of Language Resources Workshop</jpcoar:sourceTitle>
          <jpcoar:volume>6</jpcoar:volume>
          <jpcoar:pageStart>226</jpcoar:pageStart>
          <jpcoar:pageEnd>239</jpcoar:pageEnd>
          <jpcoar:file>
            <jpcoar:URI label="LRW2021_22-p3-2.pdf">https://repository.ninjal.ac.jp/record/3514/files/LRW2021_22-p3-2.pdf</jpcoar:URI>
            <jpcoar:mimeType>application/pdf</jpcoar:mimeType>
            <jpcoar:extent>821.7 kB</jpcoar:extent>
            <datacite:date dateType="Available">2022-01-04</datacite:date>
          </jpcoar:file>
        </jpcoar:jpcoar>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
