两年前做的一个开源项目github上搜livetalking,受到了比较多人的关注,目前在github已经有7.3k star。
主要功能有:
支持多种数字人模型: musetalk、wav2lip、Ultralight-Digital-Human
支持声音克隆
支持数字人说话被打断
支持webrtc、rtmp、虚拟摄像头输出
支持动作编排:不说话时播放自定义视频
支持多并发
支持自定义数字人形象
最近借助AI编程做了一次大的重构。采用plugin注册机制构建一个开放的实时流式数字人框架,开发者可轻松新增语音合成(TTS)、数字人模型(Avatar)或输出(Output)模块。
版上如果有业务需求、或者有效果更好的模型、又或者有产品化想法,都欢迎联系合作。
- 来自 水木社区APP v3.5.7
--
FROM 120.244.161.*