# PaddleMIX **Repository Path**: timihh/PaddleMIX ## Basic Information - **Project Name**: PaddleMIX - **Description**: paddlemix的复制 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: develop - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-05-16 - **Last Updated**: 2024-05-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

## 简介 PaddleMIX是基于飞桨的跨模态大模型开发套件，聚合图像、文本、视频等多种模态，覆盖视觉语言预训练，文生图，文生视频等丰富的跨模态任务。提供开箱即用的开发体验，同时满足开发者灵活定制需求，探索通用人工智能。 ## 最新进展 **2024.04.17 发布 PPDiffusers v0.24.0** * [PPDiffusers](./ppdiffusers/README.md)发布 v0.24.0 版本，支持DiT等Sora相关技术，支持SVD等多款视频生成模型 **2023.10.7 发布 PaddleMIX v1.0** * 新增图文预训练模型分布式训练能力，BLIP-2支持千亿规模训练 * 新增跨模态应用流水线[AppFlow](./applications/README.md)，一键支持自动标注，图像编辑，音生图等11种跨模态应用 * [PPDiffusers](./ppdiffusers/README.md)发布 0.19.3 版本，新增SDXL及相关任务 **2023.7.31 发布 PaddleMIX v0.1** * 首次发布PaddleMIX跨模态大模型开发套件，融合PPDiffusers多模态扩散模型工具箱，广泛支持PaddleNLP大语言模型 * 新增EVA-CLIP，BLIP-2，miniGPT-4，Stable Diffusion，ControlNet等12个跨模态大模型 ## 主要特性 - **丰富的多模态功能:** 覆盖图文预训练，文生图，跨模态视觉任务，实现图像编辑、图像描述、数据标注等多样功能 - **简洁的开发体验:** 模型统一开发接口，高效实现自定义模型开发和功能实现 - **高效的训推流程:** 全量模型打通训练推理一站式开发流程，BLIP-2，Stable Diffusion等重点模型训推性能业界领先 - **超大规模训练支持:** 可训练千亿规模图文预训练模型，百亿规模文生图底座模型 ## 任务展示 - 视频Demo展示（video Demo） https://github.com/PaddlePaddle/PaddleMIX/assets/29787866/8d32722a-e307-46cb-a8c0-be8acd93d2c8 ## 安装 1. 环境依赖 ``` pip install -r requirements.txt ``` 关于PaddlePaddle安装的详细教程请查看[Installation](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html)。 > 注：ppdiffusers部分模型需要依赖 CUDA 11.2 及以上版本，如果本地机器不符合要求，建议前往 [AI Studio](https://aistudio.baidu.com/index) 进行模型训练、推理任务。 > 如果希望使用**bf16**训练推理，请使用支持**bf16**的GPU，如A100。 2. 手动安装 ``` git clone https://github.com/PaddlePaddle/PaddleMIX cd PaddleMIX pip install -e . #ppdiffusers 安装 cd ppdiffusers pip install -e . ``` ## 教程 - [快速开始](applications/README.md/#快速开始) - [训练微调](paddlemix/tools/README.md) - [推理部署](deploy/README.md) ## 特色应用 1. 艺术风格二维码模型

体验专区: https://aistudio.baidu.com/community/app/1339

2. Mix叠图

体验专区: https://aistudio.baidu.com/community/app/1340

## 模型库

多模态预训练

扩散类模型

图文预训练

开放世界视觉模型

更多模态预训练模型

ImageBind

文生图

文生视频

LVDM

音频生成

AudioLDM

更多模型能力，可参考[模型能力矩阵](./paddlemix/examples/README.md) ## 许可证书本项目的发布受Apache 2.0 license许可认证。