# LiveTalking **Repository Path**: vebin/LiveTalking ## Basic Information - **Project Name**: LiveTalking - **Description**: 实时交互数字人 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: https://www.livetalking.ai - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 85 - **Created**: 2026-06-02 - **Last Updated**: 2026-06-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
### 2.5 快速体验
使用在线镜像创建实例即可运行:
- [UCloud 镜像](https://www.compshare.cn/images/4458094e-a43d-45fe-9b57-de79253befe4?referral_code=3XW3852OBmnD089hMMrtuU&ytag=GPU_GitHub_livetalking)
### 2.6 使用说明
### 各层说明
**API 层**
- `/human`: 接收文本,支持 echo(直接复读)和 chat(LLM 对话)模式
- `/humanaudio`: 接收音频文件直接播放
- 每个连接分配唯一 `sessionid`,支持多用户并发
**逻辑层**
- **LLM 引擎**: 对接 Qwen 等大模型生成对话回复
- **TTS 引擎**: 模块化设计,支持 EdgeTTS、GPT-SoVITS、CosyVoice、腾讯云等多种方案
- **特征提取**: 同步提取音频的声学特征(如 Mel 频谱),用于口型推理
**渲染层**
- **模型推理**: 使用深度学习模型 (Wav2Lip, MuseTalk 等) 根据音频特征生成口型画面
- **后处理**: 将生成的口型区域平滑贴回原始高清视频
**推流层**
- **WebRTC**: 低延迟浏览器端推流
- **RTMP**: 标准直播协议,支持推流到 B站/YouTube 等平台
- **虚拟摄像头**: 输出为系统摄像头设备
**插件系统**
- 基于 [registry.py](registry.py) 的去中心化注册机制,开发者可自行扩展 TTS、Avatar、Output 模块
---
## 4. API 接口
| 文档 | 说明 |
|------|------|
| [docs/api.md](docs/api.md) | 通用业务 API — WebRTC、文本/音频驱动、录制、动作编排 |
| [docs/avatar_api.md](docs/avatar_api.md) | Avatar 生成 API — 创建任务、查询进度、删除任务 |
| [docs/admin_api.md](docs/admin_api.md) | Admin 管理 API — 全局配置、会话监控、强制停止 |
---
## 5. Docker 运行
镜像说明:
- **AutoDL**: 