试了一下阿里的cosyvioce-v3.
价格便宜,0.4元/万字。但需要申请,两天后通过。默认只有一个暴躁小孩的角色longhuhu,但可以声音复刻。我上传了自己说的一段话,复刻自己的声音。但用我复刻的角色生成的语音不如默认的角色说的自然,比如重音位置停顿位置之类。可能是我本身录的效果不好,但我自己上传那段话读得也没吭哧瘪肚的,挺顺畅的。不知道为啥。另外api生成语音的时候速度也不是很快,大概20k/s左右。
仅供参考。
【 在 chunhui 的大作中提到: 】
: 我现在就在研究cozyvoice,他们家的v3 版本还要申请才能用,真是脱裤子放屁。
--
FROM 124.64.43.*