EEIS 東京大学大学院 工学系研究科 電気系工学専攻

峯松 信明 教授

本郷キャンパス

メディア・知能・計算
認知科学
知覚情報処理
知能情報学
感性情報学
学習支援システム

喋って聞いて教えてくれるコンピュータを用いた音声コミュニケーション支援

音声のテキスト化(音声認識)、テキストの音声化(音声合成)はスマホでも動く時代になりました。これらの音声技術を使って、人と人、人と機械間の、より質の高い音声コミュニケーションの実現を支援する枠組みを構築しています。音声工学以外にも、音響音声学、認知科学、言語学、脳科学など、様々な知識を身につけ、音声コミュニケーションを営む方々のQoLの向上を目指しています。

研究分野1

聴取行為のモニタリングとそれを用いた音声コミュニケーション支援

聞こえてくる音声が外国語だったり,歪んでいたり,雑音まみれだったりすると,聞き取りが難しくなります。本プロジェクトでは,脳を計測することなく,聞き取りが妨げられている様子をモニタリングする技術を構築しています。そして,それを用いて,例えば,外国語音声のリスニング力を格段に増強する方法を提案しています。2023年より東大工学部の英語教育の一環として導入されることになりました。
研究分野2

発声行為のモニタリングとそれを用いた音声コミュニケーション支援

話している内容がなかなか相手に伝わらない経験をしたことはないですか?外国語を喋る時,あるいは,雑踏の中での会話とか,どうでしょうか?本プロジェクトでは,発声行為をモニタリングし,あるべき発声行為と比較することで,どのように話すことで相手に届くのか,の支援をしています。例えば,日本人特有の癖のある英語発音から,伝わる発音にするために最低限すべきことって何でしょう?そのための技術支援を実現しています。2023年より東大工学部の英語教育の一環として導入されることになりました。
研究分野3

世界諸英語を対象とした国際コミュニケーションの分析とモデル化

国際的な環境では,誰もが英語でコミュニケーションを図ります。しかし話し手の英語発音は,母語訛り,地方訛りによって様々に変容し,更に,聞き手がどのようなタイプの英語が聞き取れるのかは,聞き手の言語背景に依存します。話し手の多様性と聞き手の多様性が出会う場が,国際的な音声コミュニケーションの場となります。本プロジェクトでは,この多様性を分析・モデル化し,より円滑な国際コミュニケーションの実現を支援する技術インフラを構築しています。
研究分野4

音声における情報創出(音声合成,感情創出,声質変換,訛り変換など)

我々は様々な情報を音声に創出し,そして,我々はその情報を聞き取ることができます。ここでは,この「創出」能力をコンピュータに実現することを狙います。音声合成,感情合成,声質変換,訛り変換など様々な応用が検討され,実用化されています。ここでは,実社会が求めているがまだ実現されていない音声への情報創出技術を考え,それを実現するための基礎検討を行う。
研究分野5

音声からの情報抽出(音声認識,話者認識,感情認識,発音評価など)

我々は様々な情報を音声に創出し,そして,我々はその情報を聞き取ることができます。ここでは,この「聞き取り」能力をコンピュータに実現することを狙います。音声認識,話者認識,感情認識,発音評価など様々な応用が検討され,実用化されています。ここでは,実社会が求めているがまだ実現されていない音声からの情報抽出技術を考え,それを実現するための基礎検討を行います。
一覧に戻る