gda-ai-agent

gda-youtube-short-creator

YouTube 短视频创作工作流。从 YouTube 链接生成 50 秒以内的口语化口播短视频,包含视频下载、字幕生成、AI 口播稿创作、TTS 配音、画面剪辑和字幕合成。使用时提供 YouTube 链接即可。

gda-ai-agent 0 Updated 3mo ago
GitHub

Install

npx skillscat add gda-ai-agent/gda-youtube-short-creator

Install via the SkillsCat registry.

SKILL.md

YouTube 短视频创作工具

快速开始

cd ~/gda-youtube-short-creator
python scripts/main.py <youtube_url>

工作流程

  1. 视频下载 - 下载 YouTube 视频
  2. 音频提取 - 从视频中提取音频
  3. 字幕生成 - 使用 AI 生成带时间戳的字幕
  4. 口播创作 - AI 根据字幕写口语化口播稿
  5. TTS 配音 - 使用 Minimax API 生成语音
  6. 画面截取 - 根据口播稿匹配字幕时间点,截取画面片段
  7. 视频合成 - 剪辑画面 + 配音 + 字幕,生成最终短视频

项目结构

gda-youtube-short-creator/
├── SKILL.md                    # 本文档
├── scripts/
│   ├── main.py                # 主入口
│   ├── download_video.py      # 下载 YouTube 视频
│   ├── extract_audio.py       # 提取音频
│   ├── generate_subtitles.py  # 生成字幕
│   ├── write_script.py        # AI 写口播稿
│   ├── tts.py                 # 文字转语音
│   ├── clip_video.py          # 画面截取
│   └── assemble.py            # 视频合成
├── references/
│   └── prompt.md              # AI 提示词模板
└── assets/
    └── .gitkeep

配置

scripts/config.py 中配置:

  • 项目根目录: PROJECT_ROOT
  • YouTube 下载目录: DOWNLOAD_DIR
  • 临时文件目录: TEMP_DIR
  • 输出目录: OUTPUT_DIR
  • TTS API: Minimax API key
  • 字幕生成: OpenAI API key

输出

每个视频会生成独立的文件夹,包含:

  • original_video.mp4 - 原始下载视频
  • audio.wav - 提取的音频
  • subtitles.srt - 字幕文件
  • script.md - AI 生成的口播稿
  • narration.wav - TTS 配音
  • short_video.mp4 - 最终短视频
  • clips/ - 截取的片段

依赖安装

pip install yt-dlp openai srt moviepy pydub requests
brew install ffmpeg