WEKO3
アイテム
ビット表現を用いた日本語テキストの正規数性の評価
https://doi.org/10.15084/0002000376
https://doi.org/10.15084/00020003761b37065d-5125-4ef9-92a4-d6743937ca0c
名前 / ファイル | ライセンス | アクション |
---|---|---|
LRW2024_25-o11.pdf (533.3 KB)
|
|
Item type | 会議発表論文 / Conference Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2024-11-13 | |||||
タイトル | ||||||
タイトル | ビット表現を用いた日本語テキストの正規数性の評価 | |||||
言語 | ja | |||||
タイトル | ||||||
タイトル | Studying Borel normality of Japanese texts in binary expression | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
言語 | ja | |||||
主題Scheme | Other | |||||
主題 | 正規数 | |||||
キーワード | ||||||
言語 | ja | |||||
主題Scheme | Other | |||||
主題 | BCCWJ | |||||
キーワード | ||||||
言語 | ja | |||||
主題Scheme | Other | |||||
主題 | 日本語テキスト | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Borel normality | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | BCCWJ | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Japanese texts | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/0002000376 | |||||
ID登録タイプ | JaLC | |||||
著者 |
田窪, 洋介
× 田窪, 洋介× 浅原, 正幸× 山崎, 誠 |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 新居浜工業高等専門学校 / 高エネルギー加速器研究機構 | |||||
言語 | ja | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 | |||||
言語 | ja | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 国立国語研究所 | |||||
言語 | ja | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Niihama College / High Energy Accelerator Research Organization | |||||
言語 | en | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | National Institute for Japanese Language and Linguistics | |||||
言語 | en | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | National Institute for Japanese Language and Linguistics | |||||
言語 | en | |||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||
内容記述タイプ | Other | |||||
内容記述 | 会議名: 言語資源ワークショップ2024, 開催地: オンライン, 会期: 2024年8月28日-29日, 主催: 国立国語研究所 言語資源開発センター, 共催: 言語資源協会, 後援: 国立情報学研究所 | |||||
言語 | ja | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 0と1をランダムに出力する乱数生成器は、暗号化通信で多用されている。近年の通信技術の発展によって、通信のセキュリティを向上させるためにより高い乱数性をもつ乱数生成器の必要性が増している。そのため、乱数生成器の開発において、ビット列の乱数性を定量的に評価することが重要となる。我々は、乱数性の評価に使用されている手法をテキストの統計的解析に応用することを考えた。最初の試みとして、日本語テキストの正規数性(Borel normality)を評価した。日本語テキストをUTF-8、SJIS、EUCの文字エンコーディングを用いて0と1のビット表現に変換し、正規数性の指標を計算した。本稿では日本語テキストの正規数性の特徴について議論する。 | |||||
言語 | ja | |||||
書誌情報 |
ja : 言語資源ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 1, p. 325-331, ページ数 7, 発行日 2024 |
|||||
関連サイト | ||||||
関連タイプ | isSupplementedBy | |||||
識別子タイプ | URI | |||||
関連識別子 | https://clrd.ninjal.ac.jp/lrw2024.html | |||||
言語 | ja | |||||
関連名称 | 言語資源ワークショップ2024 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
言語 | ja | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
出版者 | ||||||
出版者 | 国立国語研究所 | |||||
言語 | ja |