WEKO3
アイテム
膠着型言語における複雑さのトレードオフ
https://doi.org/10.15084/0002000127
https://doi.org/10.15084/000200012728843b8c-88bd-44f0-bcdc-27aa29e5d236
名前 / ファイル | ライセンス | アクション |
---|---|---|
LRW2023_18-o10.pdf
|
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2023-11-24 | |||||||||
タイトル | ||||||||||
タイトル | 膠着型言語における複雑さのトレードオフ | |||||||||
言語 | ja | |||||||||
タイトル | ||||||||||
タイトル | Complexity trade-off in agglutinative languages | |||||||||
言語 | en | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||
資源タイプ | conference paper | |||||||||
ID登録 | ||||||||||
ID登録 | 10.15084/0002000127 | |||||||||
ID登録タイプ | JaLC | |||||||||
著者 |
李, 文超
× 李, 文超
|
|||||||||
著者所属 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 浙江大学 | |||||||||
言語 | ja | |||||||||
著者所属(英) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | Zhejiang University | |||||||||
言語 | en | |||||||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 会議名: 言語資源ワークショップ2023, 開催地: オンライン, 会期: 2023年8月28日-29日, 主催: 国立国語研究所 言語資源開発センター | |||||||||
言語 | ja | |||||||||
抄録 | ||||||||||
内容記述タイプ | Abstract | |||||||||
内容記述 | 形態と統語との関係において, 格標識が豊かであればあるほど語順の自由度が上がる (complexity trade-off) (Sapir 1921, Jakobson 1936, MacFadden 2003, Sinnemäki 2014, Yan and Li 2021, 李, 劉と熊 2022)。本研究は数理言語学の手法を用いて, 70か国の言語を横断的に、格標識の豊かさ, 語順の自由度, そして両者の相関関係を分析する。形態的豊富さを測定するにPython自然言語処理ツールキットであるStanzaとspaCy-Thaiを使用し、moving-average morphological richnessとmoving-average mean size of paradigm両指標を使った。各国語順の自由度の測定に、Pythonの言語処理ツール「GiNZA」を使い、Cosine similarityとword order entropy両指標を使用した。次の2点にたどりついた。第1に, 膠着型、孤立型、抱入型と屈折型の言語データに基づいた形態的豊富さと語順の自由度の度合いが正の相関関係にある。第2に, 決定木分析に導かれた70か国の言語の区画にI類、II類とIII類とに分かれ, オーストロネシア語族、アルタイ語族、日本語、韓国語、東部ウラル諸語とインド・ヨーロッパ語族、ニジェール・コンゴ語族(ナイジェリアのイボ語; ベナンのフォン語)とアフロ・アジア語族(アラビア語)に三分的偏在する。 | |||||||||
言語 | ja | |||||||||
抄録(英) | ||||||||||
内容記述タイプ | Abstract | |||||||||
内容記述 | This study utilized 25 treebanks of 16 agglutinative languages spanning nine language families to investigate the correlation between morphological richness and word order flexibility. Morphological richness was measured at moving average morphological richness and moving average size of paradigms. Ordering flexibility was measured via cosine similarity and entropy. Statistical analysis revealed a significant positive correlation between morphological richness and word order flexibility, supporting the complexity trade-off hypothesis. Among the nine language families, it was found that Austronesian, Afro-Asiatic, and Dravidian languages exhibited lower diversity in both morphology and word order compared to Altaic, Indo-Aryan, and Uralic languages. Turkish, Uighur, Basque, and Northern Sami demonstrated the most balanced proportions of S, V, and O combinations. Within the same language family, a separation of morphology and word order was observed: the Finnic branch of the Uralic family displayed greater flexibility than the Finno-Ugric branch, and the Mongolic branch of the Altaic family exhibited stricter ordering compared to the Turkic branch. Further, by investigating the impact of language distance between L1 and L3 on language acquisition, the study concluded that languages characterized by increased word order flexibility in target languages are correlated with elevated levels of morphological richness in their native languages. | |||||||||
言語 | en | |||||||||
書誌情報 |
ja : 言語資源ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 1, p. 193-205, ページ数 13, 発行日 2023 |
|||||||||
関連サイト | ||||||||||
関連タイプ | isSupplementedBy | |||||||||
識別子タイプ | URI | |||||||||
関連識別子 | https://clrd.ninjal.ac.jp/lrw2023.html | |||||||||
言語 | ja | |||||||||
関連名称 | 言語資源ワークショップ2023 | |||||||||
フォーマット | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | application/pdf | |||||||||
言語 | ja | |||||||||
著者版フラグ | ||||||||||
出版タイプ | VoR | |||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||
出版者 | ||||||||||
出版者 | 国立国語研究所 |