スペクトログラム生成による多重奏からの聴音支援システムの開発
プロジェクト概要
ジャズではアドリブソロなどで弾かれている音符が楽譜に記入されていない場合が多く、演奏するにあたりミュージシャンの演奏している音を聴き取らなくてはいけない。しかしビッグバンドジャズのように演奏が複数種類の楽器で構成されている場合、自分の聴き取りたい楽器とそれ以外の楽器の音が混ざり、聴き取りがしにくいことが多々ある。そこで本プロジェクトでは、CDなどに収録されている多重奏の曲から、その曲を構成している複数楽器の音をそれぞれ抽出し、聴音(耳コピ—)を容易にするシステムを開発する。
本システムで用いる手法では、多重奏と、多重奏を構成している各楽器のスペクトログラムを画像として扱う。スペクトログラムとは音を短時間フーリエ変換することで得られる3次元グラフである。まず、多重奏と各楽器のスペクトログラム間の関係を機械学習によって導き、関係性モデルを作成する。次に、その関係性モデルを多重奏に適応することで、多重奏の中の各楽器のスペクトログラムを生成する。その後、生成した各スペクトログラムを逆フーリエ変換して音に戻すことで、多重奏から各楽器の音を生成する。これが多重奏から抽出した各楽器の音となる。本システムは、ユーザがスマートフォンに保存している曲に対して使用できるように、スマートフォンアプリとして実装することを想定する。
採択理由
主にビッグバンドジャズを対象として、楽曲を聞いて耳コピするために特定の楽器の演奏だけを抜き出すソフトを開発する。
音源分離の手法やソフトは競合が多い。しかしクリエータの目的・動機がとてもはっきりしているため、自分達、ひいては同じ苦労をしているプレーヤを救ってくれる可能性は高い。
PM
首藤 一幸
東京工業大学 情報理工学院 准教授
クリエータ
久野 文菜
中京大学 大学院 工学研究科 情報工学専攻
採択金額
2,304,000円