Synthesizer V

Synthesizer V版の弦巻マキちゃん登場!AI版とスタンダード版の違いは?

tsurumakimaki

AI技術を取り入れた音声合成ソフトとして開発の続いているSynthesizer V AIとCeVIO AI。今でも続々と新しい音声ライブラリが発売されています。

そして2021年6月18日、VOICEROIDで人気の高いあの「弦巻マキ」ちゃんがついに待望のSynthesizer V AI版とCeVIO AI版で株式会社AHSから発売されました!おめでとうマキちゃん!

どちらにするか非常に悩みましたが、今回私はSynthesizer Vのほうを購入させてもらいました(流石に2種類ともの購入は金銭的な問題で叶いませんでした……)。

というわけで今回はこのブログ恒例、歌唱用の音声合成ソフトであるSynthesizer Vのマキちゃんをトークで使った場合の使用感等をまとめまていきます。

Synthesizer Vのマキちゃんってどんな感じの声になんだろう?
AI版とスタンダード版があるけど、どっちにするか迷う……

という方々のご参考になれば幸いです。


 

弦巻マキとは

弦巻マキとは、AHS社より発売されているソフトフェア(Music MakerやSound Pool等)のイメージキャラクターの1人です。今では特に「VOICEROID+ 民康ともえ」のイメージキャラクターとして有名。こちらは結月ゆかり等の他のVOICEROIDと違ってサンプリング元の声優さんの名前が製品名になっているのですね。

しかし、Synthesizer V(及びCeVIO AI)では声優さんが変わり、田中真奈美さんが担当されています。なのでVOICEROID版とは声の印象が変わっています。

誕生日や好きな食べ物等、キャラクター設定がかなり凝っており、非常に親しみやすい印象です。参考:ニコニコ大百科-弦巻マキとは

音声合成ソフトとしては文章読み上げソフトのVOICEROIDしかなかったので歌わせようと思ったら歌うVOICEROIDの技術が必要でしたが、今回歌唱用の音声合成ソフトとして発売されたことにより上記の技術がなくても歌ってもらうことが可能になりました。

マキちゃんには「jamバンド」というバンドグループのメンバーであるという設定もあり、その設定を再現できるということでファンの方にとっては嬉しい限りです(因みにCeVIO AI版のほうはトークボイスとして発売されたので、今までのVOICEROIDとは違ったトークも出来るようになりました)。

今回私が購入した「Synthesizer V 弦巻マキ AI コンプリート」には従来のSynthesizer V用のライブラリ(スタンダード版)と、AI技術を取り入れたSynthesizer V AI用のライブラリの2つがセットになったものです(因みに日本語音源と英語音源の2種類画像あるのですが、今回は日本語音源のほうを購入しました)。両者にどのような違いが出てくるか楽しみですね!



早速SynthVマキちゃんでトーク!AI版とスタンダード版の違いは?

それでは早速Synthesizer V版マキちゃんに喋ってもらいましょう!

今回はUTAU音源の桃音モモちゃんと喋ってもらいました。台本はこんな感じです。

モモ「マキちゃんどうしましょう!?」

マキ「おうどうしたモモちゃん」

モモ「お絵描き用のグローブしたままお荷物受け取っちゃいました!」

マキ「あーちょっち恥ずかしいやつだね。まあ心配しなくても――」

モモ「神絵師と思われたかもしれない……!」

マキ「何の心配してんの」

動画はこちら。

こちらの動画ではAI版を使用しています。それぞれのセリフでAI版とスタンダード版を聞き比べてみましょう。

セリフ1つ目

まず一つ目のセリフです。調声データの画像はこちら。

makityosei1普段のHANASUと同じ感じで調声しています。

そしてこれをAI版とスタンダード版それぞれのマキちゃんに喋ってもらった音声データがこちら。

最初AI版を使ったとき、ピッチの調声までの段階でもかなり自然に喋ってくれて「AI版すごいな!」と思ったのですが、スタンダード版も全然負けていませんね。AI版用に調声されたデータを喋ってもらっても違和感はほとんど出ていません。どちらもかなり高性能……!

ただ声質は少々違いが感じられ、スタンダード版はAI版に比べて少々幼めな声といった感じでしょうか。まあ好みのレベルなので個人的にはそこまで気になりませんが、セリフやキャラ付けに合わせてジェンダーのパラメータを少し調節してあげてもいいかも知れませんね。

セリフ2つ目

続いて2つ目のセリフです。こちらは少々長めのセリフになります。

makityosei22つのセリフを1つのデータで調声したので長めのデータになりました。私は基本的に1つのデータで1つのセリフを調声することが多いのですが、今回みたいに同じキャラクターが連続で喋る場合は1つのデータで複数のセリフを調整しています。こちらのほうがセリフ間のピッチ曲線のバランスを調整しやすいのがメリットですね(デメリットとしては単純にデータ1つ完成させるのに時間がかかるので精神的にキツく感じることがある、といったところでしょうか……)。

そして音声データです(「心配しなくても」の後に「だい」と続いていますが、これは調声段階では残っていた「大丈夫だよ」というセリフの名残なので気にしないでください……)。

こちらのセリフではAI版の調声がスタンダード版に影響してしまっているところがありますね……。「しなくても」の辺りなのですが、AI版ではこの辺が少し幼く聞こえたのでジェンダーのパラメータを少し上げています。この効果がスタンダード版で大きめに出ており、少し太めの声になってしまいました

やはりちゃんとそれぞれのライブラリにあった調声は必要ですね。

因みに、AI版ではスタンダード版にはない「トーンシフト」というパラメータが使えます。正直どういう効果のパラメータなのかよく分かっていないのですが、使ってみたところ「ピッチ変動による声質の変化の度合いを調節する」みたいな感じの効果でしょうか……?だとしたらトークの調声ではピッチの変動が大きいことが多いのでかなり使えそうなパラメータですね。

toneshift今回のセリフで使用しているトーンシフトのパラメータ画面です(効果がまだよくわかっていないので調声はめちゃくちゃですが……)。ピッチが大きく変わる辺りで使うといい感じにハマるかも?因みに1個目のセリフではあまり使っていません。

セリフ3つ目

さあこれがラスト。3つ目のセリフです。

makityosei3今回は少し沈んだ感じの印象を出したかったので全体的に音程を低めで調声しました。

音声データはこちら。

2つ目のセリフに比べれば調声の違和感のほうはかなりなくなりましたが、別人感が1つ目のセリフより強まった気がします。低めの声だとAI版は艶やかさが増しますね。こういうキャラのマキちゃんも良いかも知れません。一方スタンダード版は声の幼さのおかげでAI版よりも可愛らしさが出てきている印象。全然関係ない話ですが、私がマキちゃんのビジュアルを見て想像していた声がこちらに近い感じでした。

あと2つ目のセリフでも少し気になっていたのですが、こちらのセリフでもAI版、スタンダード版共に「ぱ」の辺りの発音にちょっと違和感があるようなないような……。まだまだ私も調声技術不足ですね……。

まとめ AI版とスタンダード版を使ってみた感想

以上、AI版とスタンダード版のマキちゃんにそれぞれ同じセリフを喋ってもらいました。

使う前は2つともそこまで変わらないんじゃないかと思っていたのですが、こうして両者を比べてみると思っていたより違いが出てきたなと感じています。上でも触れた声の幼さもそうですが、AI版は人間らしさ、スタンダード版は合成音声らしさがそれぞれ出ていて適度に差別化されているのが良いですね!

で、結局どっちのほうがいいの?

と聞かれると非常に困るのですが、性能面でも大きな差があるわけではないので、声を聴いて好みの声質なほうを選ぶのがオススメです。

ただパラメータに関して言えば、AI版ではトーンシフトの機能が使用でき、スタンダード版では表現グループ(UTAUで言う多音階音源のような機能)がデフォルト含め5種類用意されています。なのでトーンシフトを使ってみたい場合はAI版を、表現グループを使って調声したい場合はスタンダード版を、といった選び方もアリですね。※AI版単品、スタンダード版単品はそれぞれダウンロード版のみの販売になっています。ダウンロード版はこちら↓

Synthesizer V 弦巻マキ AI ダウンロード版 – ベクターPCショップ

Synthesizer V 弦巻マキ ダウンロード版 – ベクターPCショップ

いずれにしても、どちらも非常に高性能な音源です。流石はSynthesizer V、恐ろしい音声合成ソフトですね……!


 

COMMENT

メールアドレスが公開されることはありません。