VOCALOIDの秘密

DTMマガジン増刊号には初音ミクの調教方法以外にも、これまでのDTMマガジンでは語られなかったVOCALOIDの技術的な話が載っているので結構面白い。特にVOCALOIDエンジンの開発に携わった剣持さんのコメントは興味深い。

  • VOCALOID2では1つの音程について500個程の素片を録る
  • 英語の場合は「子音から子音」があるので2500個ほどになる
  • すべての音階について録るわけではなく足りない分は合成
  • YAMAHAが提供するのは合成エンジンとEditorのインターフェースのみ
  • クリプトン社などのソフト会社で音声ライブラリの開発をすべて行う
  • YAMAHAはソフト会社に収録のマニュアルを渡してトレーニングも行う
  • 声優の音声収録は2日で合計2〜3時間程度
  • ガイドメロディに合わせて意味を成さないカタカナを歌ってレコーディング
  • 鏡音リン・レンではEditorも一部アップデートされる

9月にCV01が出たばかりで12月にCV02が出るってどんだけハイペースなんだよと思ったけど、音声の収録がこれほど短時間で終わるのならそれも納得できる。

短時間で収録を終わらせることで収録中に歌い手の声の調子が変わってしまうという問題点も回避することができるとコメントでは言っているけど、たかだか2〜3時間で「素片情報の量」と「歌声の自然さ」の関係は飽和してしまうのだろうか。もともと短時間で収録を終わらせられるように設計したとは言っているけど、素人目にはもっと素片情報を録ってもいいんじゃないかと思えてしまう。2〜3時間ってあまりに予想に反して短すぎるので(笑)

そしてKEIさんのイラストが素敵すぎる。