AI 音声変換サービスとは
RVC(Retrieval-based-Voice-Conversion)呼ばれるAI技術を用いて、入力した日本語テキストや音声データをお好みの声に変換するサービスです。
AI 音声変換サービス
テキストを入力して音声に変換する方法と、WAVやMP3の音声ファイルを入力してご希望する音声に変換する方法があります。
テキストが500文字を超えると赤い表示になります。500文字以内の黒文字表示にした後に「AI 音声変換」ボタンを押してください。テキスト入力が優先されますので、音声ファイルを入力する場合には、テキスト入力欄を空にしてください。
音声モデル
下記の音声モデルを使用しています。ウェブサイト等で音声を公開する際には、各ページの注意事項を順守してください。
AI 音声変換例
音声変換例です。朗読やニュースだけでなく、下記の通り歌声も変換できます。
歌声変換例:その1
テレビ東京系テレビアニメ『ヒカルの碁』のオープニングテーマである、dreamのGet Overを
NNSVN という歌声合成プログラムの 'yoko_latest'というデータを使用して歌声を作成し、これをオリジナルの歌声として使用しました。
NNSVN オリジナルの歌声
あみたろの歌声:高低は標準
つくよみちゃんの歌声:高低は標準
朗らか少女の歌声:高低は標準
男性の歌声:高低は-12
歌声変換例:その2
日本の伝統的な童謡である「春が来た」を、歌声変換例:その1と同様に NNSVN の 'yoko_latest'というデータを使用して歌声を作成し、これをオリジナルの歌声として使用しました。
NNSVN オリジナルの歌声
あみたろの歌声:高低は標準
つくよみちゃんの歌声:高低は標準
朗らか少女の歌声:高低は標準
男性の歌声:高低は-12
音声変換例:読み聞かせ
ここでは、夏目漱石の「吾輩は猫である」の出だしの部分を使用して、読み聞かせの例を示します。わかりやすく読めるよう、原文から、句読点や仮名遣いを多少変更しています。
入力したテキスト
吾輩は猫である。名前は、まだ無い。どこで生れたか、とんと見当がつかぬ。何でも、薄暗い、じめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかも、あとで聞くとそれは書生という人間中で一番獰悪な種族であったそうだ。この書生というのは、時々、我々を捕まえて、煮て食うという話である。しかし、その当時は何という考もなかったから、べつだん、恐しいとも思わなかった。ただ、彼の掌に載せられて、スーと持ち上げられた時、何だかフワフワした感じがあったばかりである。てのひらの上で少し落ちついて書生の顔を見たのが、いわゆる人間というものの見始めであろう。この時、妙なものだと思った感じが今でも残っている。第一、毛をもって装飾されるべきはずの顔が、つるつるして、まるで薬缶だ。その後、猫にもだいぶ逢ったが、こんな片輪には一度もでくわした事がない。のみならず、顔のまんなかがあまりに突起している。そうして、その穴の中から、時々、ぷうぷうと煙を吹く。どうも、むせぽくて実に弱った。これが、人間の飲む煙草というものである事は、ようやくこの頃知った。
あみたろの読み聞かせ:高低は標準
つくよみちゃんの読み聞かせ:高低は標準
朗らか少女の読み聞かせ:高低は標準
男性の読み聞かせ:高低は-8
音声変換例:「枕草子」の朗読例1
2024年の NHK 大河ドラマ「光る君へ」で、中宮である定子のため、清少納言(ききょう)が書いた「枕草子」の朗読例を示しましょう。
「枕草子」の朗読例の1番目は、AI 音声変換モデルとして「朗らか少女」、音声高低の選択「4」により、下記のテキストから AI 音声に変換した例です。イントネーションなど、まだまだ学習不足という感は否めません。
朗らか少女の朗読:高低は4
入力したテキスト
春はあけぼの(枕草子)
春は、あけぼの。やうやうしろくなりゆく山ぎは、すこし明りて、紫だちたる雲の、細くたなびきたる。
夏は、夜。月のころはさらなり。闇もなほ、蛍の多く飛びちがひたる。また、ただ一つ二つなど、ほのかにうち光りて行くも、をかし。雨など降るも、をかし。
秋は、夕暮れ。夕日のさして、山の端いと近うなりたるに、烏の寝どころへ行くとて、三つ四つ、二つ三つなど、飛びいそぐさへあはれなり。まいて、雁などのつらねたるが、いと小さく見ゆるは、いとをかし。日入りはてて、風の音、虫の音など、はた、言ふべきにあらず。
冬は、つとめて。雪の降りたるは、言ふべきにもあらず。霜のいと白きも。またさらでも、いと寒きに、火など急ぎおこして、炭持てわたるも、いとつきづきし。昼になりて、ぬるくゆるびもていけば、火桶の火も、白き灰がちになりて、わろし。
音声変換例:「枕草子」の朗読例2
「枕草子」の朗読例の2番目は、AI 音声変換モデルとして「朗らか少女」、音声高低の選択「4」により、
BUNGO-bun GO!の「枕草子」 の音声を使用させて頂き、音声変換のみ行った例です。文章のみから、このような綺麗な音声を制作することが現在の目標です。
朗らか少女の朗読(音声ファイルから変換):高低は4