WEKO3
アイテム
横山詔一・笹原宏之・野崎浩成・エリク=ロング『新聞電子メディアの漢字-朝日新聞CD-ROMによる漢字頻度表-』
https://doi.org/10.15084/00002021
https://doi.org/10.15084/000020212a47615b-9bd3-4aaf-874c-bd37c0a95e35
名前 / ファイル | ライセンス | アクション |
---|---|---|
kk_ngkgk_006_05.pdf (832.9 kB)
|
|
Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2019-03-25 | |||||
タイトル | ||||||
タイトル | 横山詔一・笹原宏之・野崎浩成・エリク=ロング『新聞電子メディアの漢字-朝日新聞CD-ROMによる漢字頻度表-』 | |||||
タイトル | ||||||
タイトル | YOKOYAMA Shoichi, SASAHARA Hiroyuki, NOZAKI Hironari, Eric LONG "A Study of the Use of Kanji in Electronic Newspaper Media" | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 文字統計 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 電子化テキスト | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 包摂規準 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 符号化文字集合 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 朝日文字 | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | character census | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | machine readable text | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | unification principle | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | coded character set | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | character identification | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | departmental bulletin paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00002021 | |||||
ID登録タイプ | JaLC | |||||
著者 |
豊島, 正之
× 豊島, 正之× TOYOSHIMA, Masayuki |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 東京外国語大学アジア・アフリカ言語文化研究所 | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Institute for the Study of Languages and Cultures of Asia and Africa, Tokyo University of Foreign Studies | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 本書は,「朝日新聞」原紙とそのCD-ROM版テキストファイルとを照合する事によって,成立過程から既にコード化されているテキストが,別のコード化規準の下でどの様に変容するかを克明に追究したものであり,その意味で,初の「電子メディア文献学的研究」と呼ぶべきものである。本書は,「朝日文字」を含む電子化テキストという特異な例を扱ってはいるが,文献学的な手法は,本書の扱う文字全般に徹底している。本書の方法論が,それ以前の文字計量研究との対比に於て示唆するのは,明示的で操作可能な文字の同定規準が無い限り,文字適量研究の結果は扱い難い事である。本書が紙面照合を通じて文宇同定に費やした労力は,本書の文字統計の将来の価値に大きく貢献している。これに比して,従来の文字統計研究は,本書が努力した様な文字同定の手続きが不分明で,他との統計的比較が無効になり兼ねないという問題を持つものもある。 | |||||
抄録(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | The authors' study, based on an exhaustive listing of the kanji in the articles of Asahi Shinbun, one of the major newspapers of Japan, suggests that for valid analyses of character statistics, an explicit and stable procedure for character identification is crucial. The most typical case of this is the problem of the so-called "Asahi characters" (simplified versions of kanji used in Asahi Shinbun which are not sanctioned by government decree). There are numerous discrepancies between the CD-ROM text of the newspaper and the printed one, especially because the character identification principles used in production of the CD-ROM version were sometimes inconsistent. The authors dedicated a great deal of work to the verification of the CD-ROM text based on the printed text, which justifies characterizing this work as the first philological study of machinereadable Japanese texts. | |||||
出版者 | ||||||
出版者 | 国立国語研究所 | |||||
書誌情報 |
日本語科学 en : Japanese Linguistics 巻 6, p. 91-102, 発行日 1999-10 |
|||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |