音声のモーションキャプチャー
まず、衝撃的なミクの歌から。
どうも、「入力された歌を解析して、パラメータを推定する」技術のようです。簡単に言えば、モーションキャプチャーが人間の動きを記録して、その動きをCGに反映させる技術ですが、「ぼかりす」は人間の音声(歌声?)を記録して、その成分をVocaloidに反映させる技術、という感じのようです。
一言にまとめてしまうと簡単そうですが、これは結構しんどい解析が必要そうな気がしています。動きは時間毎の座標を確定させれば一意に記録できますが、音声成分は、各成分を確実に分解できるわけではない(と思う)ので、メンドクサイ方程式を時間単位ごとに解いていくことになるような…。前後のパラメータなどから、きっと、その辺の計算を簡略化しているのでしょうね。技術論文が速く読みたいです(笑
発表は「第75回音楽情報科学研究会[音楽情報科学研究会]のようです。
(9) VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自
動推定するシステムの提案
中野倫靖,後藤真孝(産総研)
某H社の音声合成ミドルウェア「Ruby Talk」も頑張れ!(M円単位ですが・笑)
こんな企業向けオンリーな売り方だけでは食っていけないぞ!もっと、個人ユーザに買わせる間接販売の販路も拡大しないと!(笑