EEIS 東京大学大学院 工学系研究科 電気系工学専攻

齋藤 大輔 准教授

本郷キャンパス

メディア・知能・計算
知覚情報処理
知能情報学
知能ロボティクス
感性情報学

実データ指向の音声情報処理とメディア情報処理

齋藤研究室では音声情報処理の要素技術の発展・高精度化・応用を進めるとともに、それを軸としたマルチメディア情報処理について研究開発を行っています。特に近年では複数人歌唱などの複雑な歌唱現象やロボットの見た目と音声の関係性に関する分析など実世界の複雑な音現象を対象とした研究に取り組んでいます。研究スタンスとしては数理的なバックグラウンドに基づいて新しい技術を創造し、幅広く様々なメディアを取り扱うことを目指しています。

研究分野1

エージェントの見た目に適した音声設計

音声エージェントやロボットなどに、その見た目に適した音声をデザインするための技術について研究しています。具体的には適切なベース話者の選択のための選択基準や音声に人工感を付与する技術について開発を進めています。
研究分野2

合唱情報工学と歌声情報処理

近年、単一歌唱者に対する歌声情報処理は非常に発展しています。一方複数の歌唱者の調和などを統一的なシステムとして捉え、合唱という現象そのものを取り扱う場合には、単なる単一歌唱の足し合わせだけでは不十分です。複数人が同時に歌唱する合唱という現象に対して、その分析・認識・合成のための技術を研究開発しています。
研究分野3

新しい原理に基づく音声情報処理を目指して

大規模なデータと深層学習に基づくパラダイムシフトは音声情報処理にも起きています。一方利用する技術は固定化される傾向があり、データの量に基づく発展のみに依拠しがちな状況です。齋藤研究室では古典的技術から近年の技術への流れを改めて精査し、たとえばTransformer における自己注意機構の簡略化や入力情報の簡素化による音声合成モデルの挙動分析などを通して、データの量のみに頼らない、新しい原理に基づく音声情報処理の探求を目指しています。
一覧に戻る