<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-03-16T00:29:22Z</responseDate>
  <request identifier="oai:repository.ninjal.ac.jp:00001660" metadataPrefix="jpcoar_1.0" verb="GetRecord">https://repository.ninjal.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:repository.ninjal.ac.jp:00001660</identifier>
        <datestamp>2023-05-16T10:26:59Z</datestamp>
        <setSpec>245:268</setSpec>
      </header>
      <metadata>
        <jpcoar:jpcoar xmlns:datacite="https://schema.datacite.org/meta/kernel-4/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcndl="http://ndl.go.jp/dcndl/terms/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:jpcoar="https://github.com/JPCOAR/schema/blob/master/1.0/" xmlns:oaire="http://namespace.openaire.eu/schema/oaire/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rioxxterms="http://www.rioxx.net/schema/v2.0/rioxxterms/" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns="https://github.com/JPCOAR/schema/blob/master/1.0/" xsi:schemaLocation="https://github.com/JPCOAR/schema/blob/master/1.0/jpcoar_scm.xsd">
          <dc:title>形態素解析器『Sudachi』のための大規模辞書開発</dc:title>
          <dc:title xml:lang="en">Large Scale Dictionary Development for Sudachi</dc:title>
          <jpcoar:creator>
            <jpcoar:creatorName>坂本, 美保</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="ja-Kana">サカモト, ミホ</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName>川原, 典子</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="ja-Kana">カワハラ, ノリコ</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName>久本, 空海</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="ja-Kana">ヒサモト, ソラミ</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName>髙岡, 一馬</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="ja-Kana">タカオカ, カズマ</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName>内田, 佳孝</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="ja-Kana">ウチダ, ヨシタカ</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName xml:lang="en">SAKAMOTO, Miho</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName xml:lang="en">KAWAHARA, Noriko</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName xml:lang="en">HISAMOTO, Sorami</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName xml:lang="en">TAKAOKA, Kazuma</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName xml:lang="en">UCHIDA, Yoshitaka</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:subject subjectScheme="Other">UniDic</jpcoar:subject>
          <jpcoar:subject subjectScheme="Other">現代日本語書き言葉均衡コーパス(BCCWJ)</jpcoar:subject>
          <jpcoar:subject subjectScheme="Other">形態素解析</jpcoar:subject>
          <jpcoar:subject xml:lang="en" subjectScheme="Other">UniDic</jpcoar:subject>
          <jpcoar:subject xml:lang="en" subjectScheme="Other">Balanced Corpus of Contemporary Written Japanese (BCCWJ)</jpcoar:subject>
          <jpcoar:subject xml:lang="en" subjectScheme="Other">Morphological Analysis</jpcoar:subject>
          <datacite:description descriptionType="Other">会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター</datacite:description>
          <datacite:description descriptionType="Abstract">我々は，汎用的な日本語形態素解析器『Sudachi』とその辞書を開発した。本稿では，Sudachiの辞書開発内容について述べる。我々は，まず，UniDicをベースとして，見出し表記，品詞，各種パラメータ等，形態素解析をするための辞書情報を整えた。次に，実用上UniDicに不足している語句を見出しとして追加した。これには，NEologdから取り込んだ膨大な固有名称も含まれる。さらに，登録見出しについて，アプリケーションが利用しやすい形態素単位の整備，表記のゆれを同一視するための正規化表記の整備等を行い，辞書内容を充実させた。また，形態素解析精度の向上のため，UniDic由来の見出しについても，弊害となる見出しの抑制や間違いの修正，形態素単位の調整を行った。我々のこれまでの成果は，最新版の辞書ソースに反映しOSSとして公開している。</datacite:description>
          <datacite:description descriptionType="Other">application/pdf</datacite:description>
          <datacite:description descriptionType="Other">株式会社ワークスアプリケーションズ ワークス徳島人工知能NLP研究所</datacite:description>
          <datacite:description descriptionType="Other">株式会社ワークスアプリケーションズ ワークス徳島人工知能NLP研究所</datacite:description>
          <datacite:description descriptionType="Other">株式会社ワークスアプリケーションズ ワークス徳島人工知能NLP研究所</datacite:description>
          <datacite:description descriptionType="Other">株式会社ワークスアプリケーションズ ワークス徳島人工知能NLP研究所</datacite:description>
          <datacite:description descriptionType="Other">株式会社ワークスアプリケーションズ ワークス徳島人工知能NLP研究所</datacite:description>
          <datacite:description descriptionType="Other">WAP Tokushima Laboratory of AI and NLP</datacite:description>
          <datacite:description descriptionType="Other">WAP Tokushima Laboratory of AI and NLP</datacite:description>
          <datacite:description descriptionType="Other">WAP Tokushima Laboratory of AI and NLP</datacite:description>
          <datacite:description descriptionType="Other">WAP Tokushima Laboratory of AI and NLP</datacite:description>
          <datacite:description descriptionType="Other">WAP Tokushima Laboratory of AI and NLP</datacite:description>
          <dc:publisher>国立国語研究所</dc:publisher>
          <datacite:date dateType="Issued">2018</datacite:date>
          <dc:language>jpn</dc:language>
          <dc:type rdf:resource="http://purl.org/coar/resource_type/c_5794">conference paper</dc:type>
          <oaire:version rdf:resource="http://purl.org/coar/version/c_970fb48d4fbd8a85">VoR</oaire:version>
          <jpcoar:identifier identifierType="DOI">https://doi.org/10.15084/00001644</jpcoar:identifier>
          <jpcoar:identifier identifierType="URI">https://repository.ninjal.ac.jp/records/1660</jpcoar:identifier>
          <jpcoar:identifierRegistration identifierType="JaLC">10.15084/00001644</jpcoar:identifierRegistration>
          <jpcoar:relation>
            <jpcoar:relatedIdentifier identifierType="URI">https://pj.ninjal.ac.jp/corpus_center/lrw2018.html</jpcoar:relatedIdentifier>
            <jpcoar:relatedTitle>言語資源活用ワークショップ2018</jpcoar:relatedTitle>
          </jpcoar:relation>
          <jpcoar:sourceTitle>言語資源活用ワークショップ発表論文集</jpcoar:sourceTitle>
          <jpcoar:sourceTitle xml:lang="en">Proceedings of Language Resources Workshop</jpcoar:sourceTitle>
          <jpcoar:volume>3</jpcoar:volume>
          <jpcoar:pageStart>118</jpcoar:pageStart>
          <jpcoar:pageEnd>129</jpcoar:pageEnd>
          <jpcoar:file>
            <jpcoar:URI label="LRW-2018-13-P-1-08.pdf">https://repository.ninjal.ac.jp/record/1660/files/LRW-2018-13-P-1-08.pdf</jpcoar:URI>
            <jpcoar:mimeType>application/pdf</jpcoar:mimeType>
            <jpcoar:extent>403.1 kB</jpcoar:extent>
            <datacite:date dateType="Available">2019-02-14</datacite:date>
          </jpcoar:file>
        </jpcoar:jpcoar>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
