音楽情報処理

【論文読み】深層学習で複雑な音楽コードの認識をやる問題

ここで言うコードは音楽における和音のほうのコード(Chord)の事です。 コード進行自動認識技術においては、認識するコードラベルの種類をメジャートライアド+マイナートライアド+No Chordの計25種類に限定するのが一つの基準とされてきました。前の記事では、ビートルズ楽曲においてこの基準で正答率約82%を記録することができました。 この基準でもまだまだ伸びしろがありそうですが、コード認識のもう一つの課題はさらに複雑なコードです。トライ […]

論文紹介:直積HMMと、ポリフォニックMIDIスコア・フォローイング

予め用意した楽譜データと、リアルタイムの音楽演奏データをマッチングする技術を「スコア・フォローイング」というらしい。 自動伴奏等への応用を目指した技術である。 この論文では、直積HMM(隠れマルコフモデル)という手法で、和音演奏を含む演奏データをリアルタイムでフォローしようとするものらしい。 “Outer-Product Hidden Markov Model and Polyphonic MIDI Score Follow […]

音楽と機械学習 前処理編 MFCC ~ メル周波数ケプストラム係数

最近音楽を機械学習で扱うことに興味があって色々と調べているのですが、せっかくなので備忘録と理解促進を兼ねて記事にしてみます。 機械学習に限らず、音楽をデジタル情報として扱う際には楽譜や調、歌詞など、メタな情報を扱う方法と、オーディオデータそのものを扱う方法とに大別されますが、今回はオーディオデータそのものを扱う方法の一つとして、MFCCについてまとめます。 お急ぎの方向け mp3 を wav にして MFCC して現実的に扱えそうな次元 […]