WEKO3
アイテム
『中国語動画音声コーパス』の構築 : 複数モダリティによる正確な書き起こしを目指して
https://doi.org/10.15084/0002000359
https://doi.org/10.15084/0002000359abd47185-cd87-4b83-9412-9253fa801dee
名前 / ファイル | ライセンス | アクション |
---|---|---|
LRW2024_08-o07s.pdf (4.9 MB)
|
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-11-13 | |||||||||||||||||
タイトル | ||||||||||||||||||
タイトル | 『中国語動画音声コーパス』の構築 : 複数モダリティによる正確な書き起こしを目指して | |||||||||||||||||
言語 | ja | |||||||||||||||||
タイトル | ||||||||||||||||||
タイトル | The Construction of a Chinese Video-Audio Corpus : Aiming for Accurate Transcription through Multiple Modalities | |||||||||||||||||
言語 | en | |||||||||||||||||
言語 | ||||||||||||||||||
言語 | jpn | |||||||||||||||||
キーワード | ||||||||||||||||||
言語 | ja | |||||||||||||||||
主題Scheme | Other | |||||||||||||||||
主題 | コーパス | |||||||||||||||||
キーワード | ||||||||||||||||||
言語 | ja | |||||||||||||||||
主題Scheme | Other | |||||||||||||||||
主題 | 中国語 | |||||||||||||||||
キーワード | ||||||||||||||||||
言語 | en | |||||||||||||||||
主題Scheme | Other | |||||||||||||||||
主題 | corpus | |||||||||||||||||
キーワード | ||||||||||||||||||
言語 | en | |||||||||||||||||
主題Scheme | Other | |||||||||||||||||
主題 | Chines | |||||||||||||||||
資源タイプ | ||||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||||
資源タイプ | conference paper | |||||||||||||||||
ID登録 | ||||||||||||||||||
ID登録 | 10.15084/0002000359 | |||||||||||||||||
ID登録タイプ | JaLC | |||||||||||||||||
著者 |
篠崎, 秀紀
× 篠崎, 秀紀
× 于, 拙
× 陳, 宇鍇
|
|||||||||||||||||
著者所属 | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 大阪大学人文学研究科 | |||||||||||||||||
言語 | ja | |||||||||||||||||
著者所属 | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 大阪大学人文学研究科 | |||||||||||||||||
言語 | ja | |||||||||||||||||
著者所属 | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 大阪大学人文学研究科 | |||||||||||||||||
言語 | ja | |||||||||||||||||
著者所属(英) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | Osaka University Graduate School of Humanites | |||||||||||||||||
言語 | en | |||||||||||||||||
著者所属(英) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | Osaka University Graduate School of Humanites | |||||||||||||||||
言語 | en | |||||||||||||||||
著者所属(英) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | Osaka University Graduate School of Humanites | |||||||||||||||||
言語 | en | |||||||||||||||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | 会議名: 言語資源ワークショップ2024, 開催地: オンライン, 会期: 2024年8月28日-29日, 主催: 国立国語研究所 言語資源開発センター, 共催: 言語資源協会, 後援: 国立情報学研究所 | |||||||||||||||||
言語 | ja | |||||||||||||||||
抄録 | ||||||||||||||||||
内容記述タイプ | Abstract | |||||||||||||||||
内容記述 | 動画共有サイトにアップロードされている中国語の動画は,字幕が画像データとして動画のフレーム内に埋め込まれていることが圧倒的である.そのため,動画からテキストを抽出し,コーパスを作成する際には,文字認識あるいは音声認識の手法を用いる必要がある.日本において,中国人母語話者が日常的に話している言葉を集めたコーパスは多いとは言えず,その多くは中国語学習者用に作られている.我々の研究では,中国人母語話者の使用まで射程にいれ,言語研究に耐えうるようなコーパスの作成を目指す.さらに,字幕に対するOCR,音声に対する音声認識,動画制作者が用意した字幕など,複数のリソースから得られたテキストを,同時に表示するようなアプリケーションを実装する. | |||||||||||||||||
言語 | ja | |||||||||||||||||
書誌情報 |
ja : 言語資源ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 1, p. 102-112, ページ数 11, 発行日 2024 |
|||||||||||||||||
関連サイト | ||||||||||||||||||
関連タイプ | isSupplementedBy | |||||||||||||||||
識別子タイプ | URI | |||||||||||||||||
関連識別子 | https://clrd.ninjal.ac.jp/lrw2024.html | |||||||||||||||||
言語 | ja | |||||||||||||||||
関連名称 | 言語資源ワークショップ2024 | |||||||||||||||||
フォーマット | ||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||
内容記述 | application/pdf | |||||||||||||||||
言語 | ja | |||||||||||||||||
著者版フラグ | ||||||||||||||||||
出版タイプ | VoR | |||||||||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||
出版者 | ||||||||||||||||||
出版者 | 国立国語研究所 | |||||||||||||||||
言語 | ja |