WEKO3
アイテム
{"_buckets": {"deposit": "acde1768-7ed7-48fe-b066-570a4af6d9a4"}, "_deposit": {"created_by": 3, "id": "3504", "owners": [3], "pid": {"revision_id": 0, "type": "depid", "value": "3504"}, "status": "published"}, "_oai": {"id": "oai:repository.ninjal.ac.jp:00003504", "sets": ["516"]}, "author_link": ["11737", "11738", "11739", "11740", "11742", "11741"], "item_10003_biblio_info_32": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2021", "bibliographicIssueDateType": "Issued"}, "bibliographicPageEnd": "146", "bibliographicPageStart": "138", "bibliographicVolumeNumber": "6", "bibliographic_titles": [{"bibliographic_title": "言語資源活用ワークショップ発表論文集"}, {"bibliographic_title": "Proceedings of Language Resources Workshop", "bibliographic_titleLang": "en"}]}]}, "item_10003_description_27": {"attribute_name": "会議概要(会議名, 開催地, 会期, 主催者等)", "attribute_value_mlt": [{"subitem_description": "会議名: 言語資源活用ワークショップ2021, 開催地: オンライン, 会期: 2021年9月13日-14日, 主催: 国立国語研究所 コーパス開発センター", "subitem_description_type": "Other"}]}, "item_10003_description_29": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "本稿では,rtMRIデータから音響特徴量を生成するための深層学習モデルを提案する。調音器官全体を高解像度で記録できるrtMRIは,調音データから音響特徴量を生成するための元データとして有用であると考えられるが,フレームレートが比較的低いという問題がある。そこで我々は,転置畳み込みネットワークを用いて時間軸方向に超解像処理を行う方法を提案する。標準的な畳み込みニューラルネットワークが畳み込みによって主に画像の近隣情報を圧縮するのに対して,転置畳み込みネットワークではこの逆の操作を行うことにより,画像の解像度を向上させる。本手法ではこの超解像処理をrtMRIデータの時間方向に適用することによって,rtMRIデータの時間解像度を向上させる。メルケプストラム歪みとPESQを評価尺度として用いた実験の結果,転置畳み込みネットワークは正確な音響特徴量の生成に有効であることがわかった。また,超解像処理の倍率を上げることで,PESQのスコアが向上することも確認した。", "subitem_description_type": "Abstract"}]}, "item_10003_description_43": {"attribute_name": "フォーマット", "attribute_value_mlt": [{"subitem_description": "application/pdf", "subitem_description_type": "Other"}]}, "item_10003_description_51": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_description": "東京理科大学", "subitem_description_type": "Other"}, {"subitem_description": "東京理科大学", "subitem_description_type": "Other"}, {"subitem_description": "東京理科大学", "subitem_description_type": "Other"}, {"subitem_description": "東京理科大学", "subitem_description_type": "Other"}]}, "item_10003_description_52": {"attribute_name": "著者所属(英)", "attribute_value_mlt": [{"subitem_description": "Tokyo University of Science", "subitem_description_type": "Other"}, {"subitem_description": "Tokyo University of Science", "subitem_description_type": "Other"}, {"subitem_description": "Tokyo University of Science", "subitem_description_type": "Other"}, {"subitem_description": "Tokyo University of Science", "subitem_description_type": "Other"}]}, "item_10003_identifier_registration": {"attribute_name": "ID登録", "attribute_value_mlt": [{"subitem_identifier_reg_text": "10.15084/00003487", "subitem_identifier_reg_type": "JaLC"}]}, "item_10003_publisher_45": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "国立国語研究所"}]}, "item_10003_relation_40": {"attribute_name": "関連サイト", "attribute_value_mlt": [{"subitem_relation_name": [{"subitem_relation_name_text": "言語資源活用ワークショップ2021"}], "subitem_relation_type_id": {"subitem_relation_type_id_text": "https://ccd.ninjal.ac.jp/lrw2021.html", "subitem_relation_type_select": "URI"}}]}, "item_10003_version_type_44": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "丹治, 涼"}, {"creatorName": "タンジ, リョウ", "creatorNameLang": "ja-Kana"}], "nameIdentifiers": [{"nameIdentifier": "11737", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "大村, 英史"}, {"creatorName": "オオムラ, ヒデフミ", "creatorNameLang": "ja-Kana"}, {"creatorName": "OHMURA, Hidefumi", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "11738", "nameIdentifierScheme": "WEKO"}, {"nameIdentifier": "90645277", "nameIdentifierScheme": "e-Rad", "nameIdentifierURI": "https://nrid.nii.ac.jp/ja/nrid/1000090645277"}]}, {"creatorNames": [{"creatorName": "澤田, 隼"}, {"creatorName": "サワダ, シュン", "creatorNameLang": "ja-Kana"}], "nameIdentifiers": [{"nameIdentifier": "11739", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "桂田, 浩一"}, {"creatorName": "カツラダ, コウイチ", "creatorNameLang": "ja-Kana"}, {"creatorName": "KATSURADA, Kouichi", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "11740", "nameIdentifierScheme": "WEKO"}, {"nameIdentifier": "80324490", "nameIdentifierScheme": "e-Rad", "nameIdentifierURI": "https://nrid.nii.ac.jp/ja/nrid/1000080324490"}]}, {"creatorNames": [{"creatorName": "TANJI, Ryo", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "11741", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "SAWADA, Shun", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "11742", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2022-01-04"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "LRW2021_12-o1-5.pdf", "filesize": [{"value": "593.2 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 593200.0, "url": {"label": "LRW2021_12-o1-5.pdf", "url": "https://repository.ninjal.ac.jp/record/3504/files/LRW2021_12-o1-5.pdf"}, "version_id": "286b1cee-e980-4422-a5cb-8bd12a3aba2d"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "リアルタイムMRI日本語調音運動データベース", "subitem_subject_scheme": "Other"}, {"subitem_subject": "The real-time MRI articulatory movement database", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "conference paper", "resourceuri": "http://purl.org/coar/resource_type/c_5794"}]}, "item_title": "転置畳み込みニューラルネットワークを用いたrtMRIデータからの調音-音響変換", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "転置畳み込みニューラルネットワークを用いたrtMRIデータからの調音-音響変換"}, {"subitem_title": "Transposed Convolution-based Articulatory-to-Acoustic Conversion using Real-Time MRI Data", "subitem_title_language": "en"}]}, "item_type_id": "10003", "owner": "3", "path": ["516"], "permalink_uri": "https://doi.org/10.15084/00003487", "pubdate": {"attribute_name": "公開日", "attribute_value": "2022-01-07"}, "publish_date": "2022-01-07", "publish_status": "0", "recid": "3504", "relation": {}, "relation_version_is_last": true, "title": ["転置畳み込みニューラルネットワークを用いたrtMRIデータからの調音-音響変換"], "weko_shared_id": -1}
転置畳み込みニューラルネットワークを用いたrtMRIデータからの調音-音響変換
https://doi.org/10.15084/00003487
https://doi.org/10.15084/00003487ca34894e-3737-4887-ad35-3db93cfabe0b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | 会議発表論文 / Conference Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2022-01-07 | |||||
タイトル | ||||||
タイトル | 転置畳み込みニューラルネットワークを用いたrtMRIデータからの調音-音響変換 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | Transposed Convolution-based Articulatory-to-Acoustic Conversion using Real-Time MRI Data | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | リアルタイムMRI日本語調音運動データベース | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | The real-time MRI articulatory movement database | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
ID登録 | ||||||
ID登録 | 10.15084/00003487 | |||||
ID登録タイプ | JaLC | |||||
著者 |
丹治, 涼
× 丹治, 涼× 大村, 英史× 澤田, 隼× 桂田, 浩一× TANJI, Ryo× SAWADA, Shun |
|||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 東京理科大学 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 東京理科大学 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 東京理科大学 | |||||
著者所属 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 東京理科大学 | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Tokyo University of Science | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Tokyo University of Science | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Tokyo University of Science | |||||
著者所属(英) | ||||||
内容記述タイプ | Other | |||||
内容記述 | Tokyo University of Science | |||||
会議概要(会議名, 開催地, 会期, 主催者等) | ||||||
内容記述タイプ | Other | |||||
内容記述 | 会議名: 言語資源活用ワークショップ2021, 開催地: オンライン, 会期: 2021年9月13日-14日, 主催: 国立国語研究所 コーパス開発センター | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 本稿では,rtMRIデータから音響特徴量を生成するための深層学習モデルを提案する。調音器官全体を高解像度で記録できるrtMRIは,調音データから音響特徴量を生成するための元データとして有用であると考えられるが,フレームレートが比較的低いという問題がある。そこで我々は,転置畳み込みネットワークを用いて時間軸方向に超解像処理を行う方法を提案する。標準的な畳み込みニューラルネットワークが畳み込みによって主に画像の近隣情報を圧縮するのに対して,転置畳み込みネットワークではこの逆の操作を行うことにより,画像の解像度を向上させる。本手法ではこの超解像処理をrtMRIデータの時間方向に適用することによって,rtMRIデータの時間解像度を向上させる。メルケプストラム歪みとPESQを評価尺度として用いた実験の結果,転置畳み込みネットワークは正確な音響特徴量の生成に有効であることがわかった。また,超解像処理の倍率を上げることで,PESQのスコアが向上することも確認した。 | |||||
書誌情報 |
言語資源活用ワークショップ発表論文集 en : Proceedings of Language Resources Workshop 巻 6, p. 138-146, 発行日 2021 |
|||||
関連サイト | ||||||
識別子タイプ | URI | |||||
関連識別子 | https://ccd.ninjal.ac.jp/lrw2021.html | |||||
関連名称 | 言語資源活用ワークショップ2021 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
出版者 | ||||||
出版者 | 国立国語研究所 |