
字节笔记本
2026年5月13日
Pixelle-Video - AI 全自动短视频引擎,输入主题即可生成完整视频
本文介绍 Pixelle-Video,一个完全开源的 AI 全自动短视频引擎。只需输入一个主题,它就能自动完成文案撰写、AI 配图生成、语音合成、背景音乐添加和视频合成,实现零门槛短视频创作。
项目简介
Pixelle-Video 是一个开源的 AI 全自动短视频引擎项目,由 AIDC-AI 组织开发维护。截至目前,该项目在 GitHub 上已获得 15,730+ stars,主要使用 Python 编写,采用 Apache 2.0 许可证。
通过 Pixelle-Video,零剪辑经验的用户也能一句话完成短视频制作,大大降低了视频内容创作的门槛。
核心特性
1. 全自动生成
只需输入一个主题,Pixelle-Video 自动完成:撰写视频文案、生成 AI 配图/视频、合成语音解说、添加背景音乐、一键合成视频。
2. AI 智能文案
根据主题智能创作解说词,无需自己写脚本。支持 AI 生成内容和固定文案两种模式,灵活满足不同创作需求。
3. AI 生成配图与视频
每句话都配上精美的 AI 插图,支持 AI 视频生成模型(如 WAN 2.1)创建动态视频内容。
4. 多 TTS 语音支持
支持 Edge-TTS、Index-TTS 等众多主流 TTS 方案,支持声音克隆和参考音频上传。
5. 灵活的视觉定制
多种模板可选(静态模板、图片模板、视频模板),支持竖屏、横屏等多种视频尺寸,打造独特视频风格。
6. 多种 AI 模型支持
支持 GPT、通义千问、DeepSeek、Ollama 等多种 LLM 模型。基于 ComfyUI 架构,原子能力灵活组合。
技术栈
- Python - 主要开发语言
- Streamlit - Web 界面框架
- ComfyUI - 图像/视频生成工作流引擎
- Edge-TTS / Index-TTS - 语音合成
- FFmpeg - 视频处理
- uv - Python 包管理器
视频生成流程
输入主题 → 文案生成 → 配图规划 → 逐帧处理 → 视频合成
每个环节都支持灵活定制,可选择不同的 AI 模型、音频引擎、视觉风格等,满足个性化创作需求。
安装指南
Windows 一键整合包(推荐)
无需安装 Python、uv 或 ffmpeg,下载最新整合包解压后双击运行 start.bat 即可,浏览器自动打开 http://localhost:8501。
从源码安装(macOS / Linux)
前置依赖:
# 安装 uv(Python 包管理器)
# 请访问 https://docs.astral.sh/uv/getting-started/installation/
# 安装 ffmpeg
brew install ffmpeg # macOS
sudo apt install ffmpeg # Ubuntu/Debian启动项目:
git clone https://github.com/AIDC-AI/Pixelle-Video.git
cd Pixelle-Video
uv run streamlit run web/app.py浏览器会自动打开 http://localhost:8501
快速开始
- 打开 Web 界面后,展开「⚙️ 系统配置」面板
- 配置 LLM 模型(如通义千问、GPT 等)和 API Key
- 配置图像生成服务(ComfyUI 本地地址或 RunningHub API Key)
- 在左侧栏输入视频主题,选择生成模式和 BGM
- 在中间栏配置 TTS 语音和视觉风格
- 点击「🎬 生成视频」,等待完成
视频示例
Pixelle-Video 支持多种内容类型:
- 人文纪实 - 旅行、风景类短视频
- 文化解构 - 文化科普内容
- 科学思辨 - 科普知识类
- 个人成长 - 励志/方法论内容
- 历史解说 - 历史知识类
- 小说解说 - 文学内容
- 数字人口播 - AI 数字人播报
- 图生视频 - 图片转动态视频
- 动作迁移 - 参考视频动作迁移
费用方案
- 完全免费方案:LLM 使用 Ollama(本地运行)+ ComfyUI 本地部署 = 零成本
- 推荐方案:LLM 使用通义千问 + ComfyUI 本地部署,性价比极高
- 云端方案:LLM 使用 OpenAI + 图像使用 RunningHub,无需本地环境
项目链接
- GitHub 仓库:AIDC-AI/Pixelle-Video
- 使用文档:https://aidc-ai.github.io/Pixelle-Video/zh
- 许可证:Apache 2.0