# Video-Materials-AutoGEN-Workstation

**Repository Path**: elfbobo_admin_admin/Video-Materials-AutoGEN-Workstation

## Basic Information

- **Project Name**: Video-Materials-AutoGEN-Workstation
- **Description**: 一个集内容策划、AI文案自动生成、TTS 批量自动配音、(AI)图片素材合成、ASR自动提取语言字幕脚本、AI自由创作于一体的(短视频)生成工作站。方便管理每期的视频项目。
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 1
- **Created**: 2025-12-16
- **Last Updated**: 2025-12-16

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# Video Material GEN Workstation

一个集内容策划、AI文案自动生成、TTS 批量自动配音、(AI)图片素材合成、ASR自动提取语言字幕脚本、AI自由创作于一体的(短视频)生成工作站。方便管理每期的视频项目。

# ❗正在考虑使用最新LangGraph架构重构该项目，敬请期待❗

## 功能速览

- 支持按模板批量生成视频项目，脚本、图片素材(AI)、字幕和音频一键齐备。
- Gemini + TTS合成，既能改写脚本又能直接输出(带情绪的)配音。
- 图文分轨管理，可在前端随时替换图片、字幕或音频并预览结果。

## 数据展示

![抖音投放数据](img/数据.png)


## 前端界面

![界面 1](img/1.png)
![界面 2](img/2.png)
![界面 3](img/3.png)
![界面 4](img/4.png)
![界面 5](img/5.png)
![界面 6](img/6.png)

## 通过Docker 部署(目前有Bug)

1. 复制配置：`cp env.example.yaml env.yaml`，填好各个 Key。容器内建议把 `Default-Project-Root` 设为 `/data/projects`（会被映射到本地 `./data` 目录，方便持久化）。
2. 一键启动：`docker compose up -d --build`。首次会自动构建。
3. 打开 `http://localhost:8765` 使用。查看日志可用 `docker compose logs -f video-workstation`。
4. 容器是无桌面环境，“打开项目目录/打开TTS文件夹”等按钮不会弹出文件管理器，接口会直接返回路径；请在宿主机手动进入对应目录（默认挂载在当前仓库的 `./data`）。

> node如果拉不下来，推荐先使用 `docker pull node:20-alpine` , 再运行 `docker compose up -d --build` 

如果不想用 Compose，也可以用单条命令运行镜像（需要先 `docker build -t video-workstation .`）：
`docker run -d -p 8765:8765 -v $(pwd)/env.yaml:/app/env.yaml:ro -v $(pwd)/data:/data --name video-workstation video-workstation`

## 通过源码部署

1. 复制 `env.example.yaml` 为 `env.yaml`，填入自己的 Gemini Key、Base URL、模型、TTS Key 与提示词等配置，否则无法调用接口。
2. （可选）在 `env.yaml` 中设置 `Default-Project-Root`，用于存放自动生成的脚本、音频与图片文件。
3. 安装依赖：`npm install`。
4. 启动服务：`npm start` 或直接双击 `start.bat`，默认访问地址为 `http://localhost:8765`。

## 功能介绍

1. **项目总览**：以卡片形式管理批量项目，显示输出目录、创建时间及删除动作，便于快速定位。
2. **文案生成**：结构化展示场景脚本，可复制单条或整段文案，左侧勾选联动右侧提示词。
3. **字幕获取**: 需配合我的另一个项目(n8n-http-tools): 开源地址:[n8n-http-tools](https://github.com/Norsico/n8n-http-tools)
4. **TTS 合成**：支持单条与批量两种模式，输入合成文本与情感提示即可生成语音。
5. **图片生成**：集中管理角色描述、场景描述等提示词，勾选后即可批量复制到绘图任务。
6. **立绘/背景等生成**：提供提示词输入、参考图上传、宽高比设置与历史记录，方便随时复用素材。
7. **逆向接口实现ASR自动提取剪辑需要的字幕文件**：在TTS合成界面下方，有“字幕生成”功能，点击下方的按钮可以打开字幕生成工具。此部分代码由其它作者开源。
8. **常用提示词与自由创作**：收藏高频提示词并一键复制，同时提供自由创作面板进行自定义绘制。

### 其它功能我就懒得一个一个写了，具体有啥自己可以部署一下去玩，注意文案生成这里需要配合n8n来操作，之前写的n8n文件找不到了，所以这部分其实可以忽略，主要就是一个用于生成文案的脚本AI提示词以及我主页另一个仓库中有的一个开源的B站视频字幕提取器（当然网上也有）（参考别人高播放的视频自己学起来也会快很多）

## 接下来如何好好利用这个项目还是得靠自己。
### 因为主要还是偏向管理用的（简单来讲就是功能不会有你想象的那么实用），视频内容如何定义，如何打造爆款还是需要动脑子。当然本项目里面使用图像编辑模型的是NanoBanana，本地部署的AIStudio的反向代理的接口，用来生图然后给Sora也是不错的，起码测试下来比较稳定。

## Star History

<a href="https://www.star-history.com/#Norsico/Video-Materials-AutoGEN-Workstation&type=date&legend=bottom-right">
 <picture>
   <source media="(prefers-color-scheme: dark)" srcset="https://api.star-history.com/svg?repos=Norsico/Video-Materials-AutoGEN-Workstation&type=date&theme=dark&legend=bottom-right" />
   <source media="(prefers-color-scheme: light)" srcset="https://api.star-history.com/svg?repos=Norsico/Video-Materials-AutoGEN-Workstation&type=date&legend=bottom-right" />
   <img alt="Star History Chart" src="https://api.star-history.com/svg?repos=Norsico/Video-Materials-AutoGEN-Workstation&type=date&legend=bottom-right" />
 </picture>
</a>

## 免责声明

### 项目仅共参考交流学习使用，不对任何使用者产生的问题负责