WEKO3
アイテム
転置畳み込みニューラルネットワークを用いたrtMRIデータからの調音-音響変換
https://doi.org/10.15084/00003487
https://doi.org/10.15084/00003487ca34894e-3737-4887-ad35-3db93cfabe0b
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
| Item type | 会議発表論文 / Conference Paper(1) | |||||
|---|---|---|---|---|---|---|
| 公開日 | 2022-01-07 | |||||
| タイトル | ||||||
| タイトル | 転置畳み込みニューラルネットワークを用いたrtMRIデータからの調音-音響変換 | |||||
| タイトル | ||||||
| タイトル | Transposed Convolution-based Articulatory-to-Acoustic Conversion using Real-Time MRI Data | |||||
| 言語 | en | |||||
| 言語 | ||||||
| 言語 | jpn | |||||
| キーワード | ||||||
| 主題Scheme | Other | |||||
| 主題 | リアルタイムMRI日本語調音運動データベース | |||||
| キーワード | ||||||
| 言語 | en | |||||
| 主題Scheme | Other | |||||
| 主題 | The real-time MRI articulatory movement database | |||||
| 資源タイプ | ||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
| 資源タイプ | conference paper | |||||
| ID登録 | ||||||
| ID登録 | 10.15084/00003487 | |||||
| ID登録タイプ | JaLC | |||||
| 著者 |
丹治, 涼
× 丹治, 涼× 大村, 英史× 澤田, 隼× 桂田, 浩一× TANJI, Ryo× SAWADA, Shun |
|||||
| 著者所属 | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | 東京理科大学 | |||||
| 著者所属 | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | 東京理科大学 | |||||
| 著者所属 | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | 東京理科大学 | |||||
| 著者所属 | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | 東京理科大学 | |||||
| 著者所属(英) | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | Tokyo University of Science | |||||
| 著者所属(英) | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | Tokyo University of Science | |||||
| 著者所属(英) | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | Tokyo University of Science | |||||
| 著者所属(英) | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | Tokyo University of Science | |||||
| 会議概要(会議名, 開催地, 会期, 主催者等) | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | 会議名: 言語資源活用ワークショップ2021, 開催地: オンライン, 会期: 2021年9月13日-14日, 主催: 国立国語研究所 コーパス開発センター | |||||
| 抄録 | ||||||
| 内容記述タイプ | Abstract | |||||
| 内容記述 | 本稿では,rtMRIデータから音響特徴量を生成するための深層学習モデルを提案する。調音器官全体を高解像度で記録できるrtMRIは,調音データから音響特徴量を生成するための元データとして有用であると考えられるが,フレームレートが比較的低いという問題がある。そこで我々は,転置畳み込みネットワークを用いて時間軸方向に超解像処理を行う方法を提案する。標準的な畳み込みニューラルネットワークが畳み込みによって主に画像の近隣情報を圧縮するのに対して,転置畳み込みネットワークではこの逆の操作を行うことにより,画像の解像度を向上させる。本手法ではこの超解像処理をrtMRIデータの時間方向に適用することによって,rtMRIデータの時間解像度を向上させる。メルケプストラム歪みとPESQを評価尺度として用いた実験の結果,転置畳み込みネットワークは正確な音響特徴量の生成に有効であることがわかった。また,超解像処理の倍率を上げることで,PESQのスコアが向上することも確認した。 | |||||
| 書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 6, p. 138-146, 発行日 2021 |
|||||
| 関連サイト | ||||||
| 識別子タイプ | URI | |||||
| 関連識別子 | https://ccd.ninjal.ac.jp/lrw2021.html | |||||
| 関連名称 | 言語資源活用ワークショップ2021 | |||||
| フォーマット | ||||||
| 内容記述タイプ | Other | |||||
| 内容記述 | application/pdf | |||||
| 著者版フラグ | ||||||
| 出版タイプ | VoR | |||||
| 出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
| 出版者 | ||||||
| 出版者 | 国立国語研究所 | |||||