[ITmedia News] Microsoft、3秒分の音声だけでその人の声を真似るAI「VALL-E」のサンプル公開

RSS
この記事は約1分で読めます。

Microsoftは、人間の話す声の3秒分のデータを与えると、その人の声でテキストを読み上げられるようになるAI「VALL-E」を発表した。GitHubでサンプル音声を試聴できる。