# PaddleMIX **Repository Path**: timihh/PaddleMIX ## Basic Information - **Project Name**: PaddleMIX - **Description**: paddlemix的复制 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: develop - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-05-16 - **Last Updated**: 2024-05-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

## 简介 PaddleMIX是基于飞桨的跨模态大模型开发套件,聚合图像、文本、视频等多种模态,覆盖视觉语言预训练,文生图,文生视频等丰富的跨模态任务。提供开箱即用的开发体验,同时满足开发者灵活定制需求,探索通用人工智能。 ## 最新进展 **2024.04.17 发布 PPDiffusers v0.24.0** * [PPDiffusers](./ppdiffusers/README.md)发布 v0.24.0 版本,支持DiT等Sora相关技术,支持SVD等多款视频生成模型 **2023.10.7 发布 PaddleMIX v1.0** * 新增图文预训练模型分布式训练能力,BLIP-2支持千亿规模训练 * 新增跨模态应用流水线[AppFlow](./applications/README.md),一键支持自动标注,图像编辑,音生图等11种跨模态应用 * [PPDiffusers](./ppdiffusers/README.md)发布 0.19.3 版本,新增SDXL及相关任务 **2023.7.31 发布 PaddleMIX v0.1** * 首次发布PaddleMIX跨模态大模型开发套件,融合PPDiffusers多模态扩散模型工具箱,广泛支持PaddleNLP大语言模型 * 新增EVA-CLIP,BLIP-2,miniGPT-4,Stable Diffusion,ControlNet等12个跨模态大模型 ## 主要特性 - **丰富的多模态功能:** 覆盖图文预训练,文生图,跨模态视觉任务,实现图像编辑、图像描述、数据标注等多样功能 - **简洁的开发体验:** 模型统一开发接口,高效实现自定义模型开发和功能实现 - **高效的训推流程:** 全量模型打通训练推理一站式开发流程,BLIP-2,Stable Diffusion等重点模型训推性能业界领先 - **超大规模训练支持:** 可训练千亿规模图文预训练模型,百亿规模文生图底座模型 ## 任务展示 - 视频Demo展示(video Demo) https://github.com/PaddlePaddle/PaddleMIX/assets/29787866/8d32722a-e307-46cb-a8c0-be8acd93d2c8 ## 安装 1. 环境依赖 ``` pip install -r requirements.txt ``` 关于PaddlePaddle安装的详细教程请查看[Installation](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html)。 > 注:ppdiffusers部分模型需要依赖 CUDA 11.2 及以上版本,如果本地机器不符合要求,建议前往 [AI Studio](https://aistudio.baidu.com/index) 进行模型训练、推理任务。 > 如果希望使用**bf16**训练推理,请使用支持**bf16**的GPU,如A100。 2. 手动安装 ``` git clone https://github.com/PaddlePaddle/PaddleMIX cd PaddleMIX pip install -e . #ppdiffusers 安装 cd ppdiffusers pip install -e . ``` ## 教程 - [快速开始](applications/README.md/#快速开始) - [训练微调](paddlemix/tools/README.md) - [推理部署](deploy/README.md) ## 特色应用 1. 艺术风格二维码模型

体验专区: https://aistudio.baidu.com/community/app/1339

2. Mix叠图

体验专区: https://aistudio.baidu.com/community/app/1340

## 模型库
多模态预训练 扩散类模型
  • 图文预训练
  • 开放世界视觉模型
  • 更多模态预训练模型
  • 文生图
  • 文生视频
  • 音频生成
  • 更多模型能力,可参考[模型能力矩阵](./paddlemix/examples/README.md) ## 许可证书 本项目的发布受Apache 2.0 license许可认证。