YouTube 短视频创作工作流。从 YouTube 链接生成 50 秒以内的口语化口播短视频,包含视频下载、字幕生成、AI 口播稿创作、TTS 配音、画面剪辑和字幕合成。使用时提供 YouTube 链接即可。
Install
npx skillscat add gda-ai-agent/gda-youtube-short-creator Install via the SkillsCat registry.
SKILL.md
YouTube 短视频创作工具
快速开始
cd ~/gda-youtube-short-creator
python scripts/main.py <youtube_url>工作流程
- 视频下载 - 下载 YouTube 视频
- 音频提取 - 从视频中提取音频
- 字幕生成 - 使用 AI 生成带时间戳的字幕
- 口播创作 - AI 根据字幕写口语化口播稿
- TTS 配音 - 使用 Minimax API 生成语音
- 画面截取 - 根据口播稿匹配字幕时间点,截取画面片段
- 视频合成 - 剪辑画面 + 配音 + 字幕,生成最终短视频
项目结构
gda-youtube-short-creator/
├── SKILL.md # 本文档
├── scripts/
│ ├── main.py # 主入口
│ ├── download_video.py # 下载 YouTube 视频
│ ├── extract_audio.py # 提取音频
│ ├── generate_subtitles.py # 生成字幕
│ ├── write_script.py # AI 写口播稿
│ ├── tts.py # 文字转语音
│ ├── clip_video.py # 画面截取
│ └── assemble.py # 视频合成
├── references/
│ └── prompt.md # AI 提示词模板
└── assets/
└── .gitkeep配置
在 scripts/config.py 中配置:
- 项目根目录:
PROJECT_ROOT - YouTube 下载目录:
DOWNLOAD_DIR - 临时文件目录:
TEMP_DIR - 输出目录:
OUTPUT_DIR - TTS API: Minimax API key
- 字幕生成: OpenAI API key
输出
每个视频会生成独立的文件夹,包含:
original_video.mp4- 原始下载视频audio.wav- 提取的音频subtitles.srt- 字幕文件script.md- AI 生成的口播稿narration.wav- TTS 配音short_video.mp4- 最终短视频clips/- 截取的片段
依赖安装
pip install yt-dlp openai srt moviepy pydub requests
brew install ffmpeg