<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-03-16T00:16:04Z</responseDate>
  <request identifier="oai:repository.ninjal.ac.jp:02000356" metadataPrefix="jpcoar_1.0" verb="GetRecord">https://repository.ninjal.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:repository.ninjal.ac.jp:02000356</identifier>
        <datestamp>2024-11-14T05:50:54Z</datestamp>
        <setSpec>245:1731477595303</setSpec>
      </header>
      <metadata>
        <jpcoar:jpcoar xmlns:datacite="https://schema.datacite.org/meta/kernel-4/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcndl="http://ndl.go.jp/dcndl/terms/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:jpcoar="https://github.com/JPCOAR/schema/blob/master/1.0/" xmlns:oaire="http://namespace.openaire.eu/schema/oaire/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rioxxterms="http://www.rioxx.net/schema/v2.0/rioxxterms/" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns="https://github.com/JPCOAR/schema/blob/master/1.0/" xsi:schemaLocation="https://github.com/JPCOAR/schema/blob/master/1.0/jpcoar_scm.xsd">
          <dc:title xml:lang="ja">カタカナ語の意味分類に対する大規模言語モデルの有効性検証</dc:title>
          <dc:title xml:lang="en">Validation of a Large-Scale Linguistic Model forSemantic Classification of Katakana Words</dc:title>
          <jpcoar:creator>
            <jpcoar:creatorName xml:lang="ja">小滝, 主紀</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="en">Kodaki, Kazuki</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName xml:lang="ja">佐々木, 稔</jpcoar:creatorName>
            <jpcoar:creatorName xml:lang="en">Sasaki, Minoru</jpcoar:creatorName>
          </jpcoar:creator>
          <datacite:description xml:lang="ja" descriptionType="Other">会議名: 言語資源ワークショップ2024, 開催地: オンライン, 会期: 2024年8月28日-29日, 主催: 国立国語研究所 言語資源開発センター, 共催: 言語資源協会, 後援: 国立情報学研究所</datacite:description>
          <datacite:description xml:lang="ja" descriptionType="Abstract">本稿では、LLM を用いてカタカナ語の文脈中の意味分類を行った手法と結果について報告する。ChatGPT などの生成 AI の学習に用いられる資源の多くは英語で占められており、日本語の資源はあまり使用されていない。そのため日本語に含まれるカタカナ語は対応する英単語の意味と異なる場合があり、文脈中の意味分類が正しく行われない可能性が高い。そこで『現代日本語書き言葉均衡コーパス』(BCCWJ) に含まれる文章からカタカナ語を含む文章を抽出し、その中から数個の単語を対象として、gpt-3.5-turbo, gpt-4o, gpt-4o-mini, Gemini-Pro,Swallow の 5 つの LLM を用いて Few-shot Learning を行った。実験 1 と実験 2 では生成 AIが作成した意味区分を利用した際の意味分類とプロンプト中で役割を与えることによる影響を、実験 3 では人間の定義した Wiktionary の意味区分を利用した場合の意味分類を上記のLLM で検証した。結果として生成 AI、Wiktionary どちらの意味区分を扱った意味分類でも gpt-4o が最も平均正解率が高く、gpt-4o と Gemini-Pro は役割を与えることでほとんどのプロンプトで回答精度が向上したことが確認できた。また gpt-4o-mini と Gemini-Pro ではWiktionary の意味区分を利用したほうが平均正解率が 20% 以上高くなった。さらに単語による各 LLM 間での正解率の差異もみられ、gpt-4o,gpt-4o,mini,Gemini-Pro 間で顕著であった。</datacite:description>
          <datacite:description xml:lang="ja" descriptionType="Other">application/pdf</datacite:description>
          <datacite:description xml:lang="ja" descriptionType="Other">茨城大学大学院</datacite:description>
          <datacite:description xml:lang="ja" descriptionType="Other">茨城大学</datacite:description>
          <datacite:description xml:lang="en" descriptionType="Other">Ibaraki University</datacite:description>
          <datacite:description xml:lang="en" descriptionType="Other">Ibaraki University</datacite:description>
          <dc:publisher xml:lang="ja">国立国語研究所</dc:publisher>
          <datacite:date dateType="Issued">2024</datacite:date>
          <dc:language>jpn</dc:language>
          <dc:type rdf:resource="http://purl.org/coar/resource_type/c_5794">conference paper</dc:type>
          <oaire:version rdf:resource="http://purl.org/coar/version/c_970fb48d4fbd8a85">VoR</oaire:version>
          <jpcoar:identifier identifierType="DOI">https://doi.org/10.15084/0002000356</jpcoar:identifier>
          <jpcoar:identifier identifierType="URI">https://repository.ninjal.ac.jp/records/2000356</jpcoar:identifier>
          <jpcoar:identifierRegistration identifierType="JaLC">10.15084/0002000356</jpcoar:identifierRegistration>
          <jpcoar:relation relationType="isSupplementedBy">
            <jpcoar:relatedIdentifier identifierType="URI">https://clrd.ninjal.ac.jp/lrw2024.html</jpcoar:relatedIdentifier>
            <jpcoar:relatedTitle xml:lang="ja">言語資源ワークショップ2024</jpcoar:relatedTitle>
          </jpcoar:relation>
          <jpcoar:sourceTitle xml:lang="ja">言語資源ワークショップ発表論文集</jpcoar:sourceTitle>
          <jpcoar:sourceTitle xml:lang="en">Proceedings of Language Resources Workshop</jpcoar:sourceTitle>
          <jpcoar:volume>1</jpcoar:volume>
          <jpcoar:numPages>18</jpcoar:numPages>
          <jpcoar:pageStart>59</jpcoar:pageStart>
          <jpcoar:pageEnd>76</jpcoar:pageEnd>
          <jpcoar:file>
            <jpcoar:URI label="LRW2024_05-o04s.pdf">https://repository.ninjal.ac.jp/record/2000356/files/LRW2024_05-o04s.pdf</jpcoar:URI>
            <jpcoar:mimeType>application/pdf</jpcoar:mimeType>
            <jpcoar:extent>510.4 KB</jpcoar:extent>
            <datacite:date dateType="Available">2024-11-13</datacite:date>
          </jpcoar:file>
        </jpcoar:jpcoar>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
