"AI短片/短视频/短剧全流程自动制作管线。触发词:movie agent, 短片制作, AI短片, 视频管线, film pipeline, AI视频制作, 短视频管线, AI电影, 影片制作, AI短剧, 短剧制作, 视频自动化, 全自动视频, 一键生成视频, AI拍片, 视频工厂, 批量视频, 生成短片, make video, create film, video pipeline, movie production, AI filmmaker。覆盖需求确认→调研→剧本→美术方向→角色设计→配音→场景生成→分镜板→视频生成→后期合成的完整管线,支持git版本管理和断点续传。"
Resources
9Install
npx skillscat add kaiger666888/kais-gold-team Install via the SkillsCat registry.
kais-movie-agent — AI 短片制作全流程管线
触发词
movie agent, 短片制作, AI短片, 视频管线, film pipeline, movie-wuji, AI视频制作, 短视频管线, AI电影, 影片制作, AI短剧, 短剧制作, 视频自动化, 全自动视频, 一键生成视频, AI拍片, 视频工厂, 批量视频, 生成短片, make video, create film, video pipeline, movie production, AI filmmaker, kais-movie, movie pipeline
⚠️ 强制审核门(Review Gate)
以下 Phase 完成后必须暂停,展示产出物给用户审核,收到确认后才能继续:
| Phase | 审核内容 | 展示方式 |
|---|---|---|
| Phase 1 | 需求确认 + 调研报告 | 发送调研摘要到当前会话,等用户确认 |
| Phase 2 | 美术方向(mood board 3选1 + 光影参考图) | 发送图片到当前会话,等用户选择/修改 |
| Phase 3 | 角色设计(转面图 + 多角度参考图) | 发送图片到当前会话,等用户确认 |
| Phase 4 | 剧本(scenario.json + 分镜描述) | 发送文本摘要到当前会话,等用户确认 |
| Phase 5/5.6 | 场景图(所有镜头的渲染图) | 发送图片到当前会话,等用户确认 |
| Phase 6 | 分镜板(完整 storyboard) | 发送分镜摘要到当前会话,等用户确认 |
| Phase 7 | 视频粗剪(rough cut) | 发送视频或截图到当前会话,等用户确认 |
执行规则:
- 到达审核门时,必须停止执行,不要继续下一个 Phase
- 将产出物发送给用户,附上简要说明和审核选项(✅通过 / 🔄重做 / ✏️修改)
- 使用
message工具发送图片(带 inline buttons 让用户选择) - 只有收到用户明确的"通过"回复后,才能执行 git checkpoint 并进入下一阶段
- 用户要求重做时,回滚到对应 Phase 重新生成
- 禁止:一次性跑完多个 Phase 然后事后补审核
为什么这很重要: AI 生成结果不可预测,用户审美和预期可能与 AI 不同。跳过审核会导致大量返工和积分浪费。审核门是质量保障的核心机制,不是可选步骤。
管线流程
设计原则:叙事先行 — 先立故事骨架,再匹配视觉和角色。遵循真实电影工业流程:剧本 → 美术指导 → 选角 → 分镜 → 拍摄。
Phase 1: 需求确认 + 深度调研 → 🔒 REVIEW GATE
└─ 四维蓝图生成(1st-director) → checkpoint (自动)
└─ Phase 1.5a: 选题发散 (kais-topic-selector + 约束聚合) → checkpoint (自动)
└─ Phase 1.5: 品牌与背景深度调研 (deep-research) → checkpoint (自动)
└─ Phase 1.6: 选题投票筛选 (kais-audience) → checkpoint (自动)
Phase 2: 剧本大纲 (kais-scenario-writer) → 🔒 REVIEW GATE
└─ 剧本预测试 (kais-audience 深度测评) → checkpoint (自动)
Phase 3: 美术方向 (kais-art-direction) → 🔒 REVIEW GATE
Phase 4: 角色设计 (kais-character-designer + kais-blender-pose) → 🔒 REVIEW GATE
└─ 剧本量化分析 (kais-story-score, 可选) → checkpoint (自动)
Phase 4.5: 配音 (kais-voice) → 🔒 REVIEW GATE
Phase 5: 场景图生成 (kais-scene-designer) → checkpoint
Phase 5.3: 线稿生成(anatomy-guard 预防) → checkpoint
Phase 5.5: 基于线稿渲染 → checkpoint
Phase 5.6: 渲染审核 → 🔒 REVIEW GATE
Phase 5.7: 拍摄手法规划 → checkpoint
Phase 6: 分镜板 (kais-storyboard-designer + kais-blender-pose) → 🔒 REVIEW GATE
Phase 7: 视频生成 (kais-camera + 延长链) → 🔒 REVIEW GATE
Phase 8: 后期合成 + 交付 → checkpoint
└─ Phase 8.5: 质量门控 (6维度 + story-score注入) → 🔒 APPROVE/WARN/REJECT📖 完整 Phase 流程图(含子步骤)见 `references/pipeline-flow.md`
四维蓝图(1st-director 元层)
Phase 1 完成后自动生成四维约束蓝图(blueprint.json),作为元层注入整个管线:
| 尺度 | 时间粒度 | 关注点 |
|---|---|---|
| 神经尺度 | 0.1-1s | 预测误差、注意力锚点、归因闭环 |
| 情绪尺度 | 3-10s | 锯齿循环、张力递进、无平淡期 |
| 叙事尺度 | 10-30s | 价值缺口、身份投射、价值兑现 |
| 社交尺度 | 30-60s | 截图时刻、引用候选、模因密度 |
蓝图自动影响:约束注入(Phase 2+)、熵注入(Phase 7)、质量门控权重(Phase 8.5)。无蓝图时系统行为与集成前完全一致。
Phase 1.5a(选题发散 — kais-topic-selector + 约束聚合)
触发条件:Phase 1 完成后自动执行。无需人工触发。
约束来源(多系统聚合):
- 🧠 1st-director 四维尺度 → 选题必须满足神经/情感/叙事/社会层标准
- 🚦 quality-gate 6维度 → 每个候选选题预打分(hook/structure/realism/title/duration/engagement)
- 🗳️ kais-audience 受众匹配 → 选题符合目标人群偏好
- 📱 平台约束 → 最佳时长/格式/避免元素
- 🎨 四维蓝图(如有)→ 额外的认知走查约束
输入:Phase 1 需求确认结果 + 四维蓝图(如有)
输出:3-5 个候选选题(每个带 6 维度预评分 + 总分排名),保存为 candidate-topics.json
与 Phase 1.6 的关系:候选选题自动进入投票筛选,排名最高者进入 Phase 2。Phase 1.6 的 placement_options 改为从 candidateTopics 读取。
容错:LLM 调用失败只 warn 不阻断管线,后续阶段可手动提供选题。
Phase 1.5(品牌与背景深度调研)
📖 完整调研流程见 `references/research-workflow.md`
触发条件:品牌植入、真实人物/事件、特定行业/圈层时自动启用。纯虚构题材可跳过。
| 维度 | 输出 |
|---|---|
| 品牌深度 | research/brand_profile.md |
| 人物背景 | research/character_profile.md |
| 目标受众 | research/audience_persona.md |
| 竞品案例 | research/competitor_cases.md |
| 圈层文化 | research/subculture_notes.md |
| 植入策略 | research/placement_strategy.md |
Phase 1.6(选题投票筛选 — kais-audience)
触发条件:Phase 1.5 产出 3+ 个选题方向时自动启用。单选题或用户已明确指定方向时跳过。
执行方式:调用 kais-audience 的「快速投票」模式,让虚拟评审团对候选选题进行排名。
输入:Phase 1.5 产出的 placement_options(3-5 个植入方案/选题方向)
+ research/audience_persona.md(目标受众画像)
执行:kais-audience 快速投票模式(12人评审团,兴趣度+完播意愿+互动意愿)
输出:选题排名表 + 推荐选题 + 各选题一句话优缺点
保存:research/audience_vote_result.md与 Phase 2 的关系:排名最高的选题自动进入 Phase 2 剧本创作。用户也可从排名中选择非第一的选题。
Phase 2 审核增强(kais-audience 深度测评)
Phase 2 剧本完成后、用户审核前,自动运行 kais-audience 的「深度测评」模式:
输入:Phase 2 产出的 scenario.json + story_bible.json
执行:kais-audience 深度测评模式
输出:
- 完播率预测(校准后 + 置信区间)
- 毒点检测(6大类,每类风险等级)
- 情绪曲线预测
- 分群反馈
- 优化建议
保存:research/audience_deep_test.md审核门行为:将深度测评结果作为审核依据之一展示给用户,标注高风险毒点和完播率预测。用户决定是否通过或修改后重新测评。
为什么剧本先行?
| 旧顺序 | 新顺序 | 原因 |
|---|---|---|
| 美术→角色→剧本 | 剧本→美术→角色 | 视觉服务于叙事,不是反过来 |
| 先定风格再想故事 | 先有故事再匹配风格 | 大纲的画面意图标注让风格选择有依据 |
| 角色在剧本之前 | 角色基于剧本需求设计 | 避免设计了用不上的角色 |
| — | 大纲含画面意图 | Phase 2 产出同时标注视觉方向,下游无缝衔接 |
Phase 2(剧本大纲)产出规范
📖 完整 JSON schema 见 `references/scenario-schema.md`
关键字段:visual_intent(视觉意图)、style_hints(风格提示)、character_hints(角色提示)— 给下游 Phase 3/4 的约束信号。
Git 版本管理(每个 Phase 自动 checkpoint)
每个 Phase 完成后自动创建 git checkpoint,支持回滚到任意阶段。
使用方式
📖 完整 API 用法见 `references/api-usage.md`
import { GitStageManager } from './lib/git-stage-manager.js';
const git = new GitStageManager('/path/to/project');
await git.init(); // 首次调用初始化
// Phase 完成后
await git.checkpoint('art-direction', {
description: '赛博朋克风格,霓虹色调',
metrics: { moodBoardCount: 5 }
});
// 查看历史
await git.log();
// 回滚到指定阶段(如审核不通过)
await git.rollback('art-direction');CLI
node lib/git-stage-manager.js init <workdir> # 初始化
node lib/git-stage-manager.js checkpoint <workdir> <phase> # checkpoint
node lib/git-stage-manager.js log <workdir> # 查看历史
node lib/git-stage-manager.js rollback <workdir> <phase> # 回滚Phase 与 Git Stage 映射
| Stage Name | Phase | 产出文件 |
|---|---|---|
requirement |
1 | requirement.json, brief.md, research-report.md |
research |
1.5 | research/*.md, research_summary.json |
audience-vote |
1.6 | research/audience_vote_result.md |
audience-test |
2 | research/audience_deep_test.md |
scenario |
2 | scenario.json, story_bible.json, style_hints |
art-direction |
3 | art_direction.json, mood_board.png, color_palette.json |
character |
4 | characters.json, CHARACTERS_DIR/*.png |
scene |
5 | PROJECT_ASSETSscenes/*.png, scene_design.json |
sketch |
5.3 | PROJECT/PROJECT_ASSETSsketches/*.png |
render |
5.5 | PROJECT_ASSETSscenes/*.png (渲染版) |
storyboard |
6 | storyboard.json, shots.json |
camera |
7 | video_tasks.json, output/*.mp4, rough_cut.mp4 |
delivery |
8 | final.mp4, qc_report.json |
线稿控制管线(Phase 5.3-5.6)
⚠️ 强制规则:所有镜头必须先线稿后渲染,无例外。 不考虑积分成本,质量优先。
线稿是构图和比例的保险锁,跳过线稿直接渲染会导致比例失调、构图崩坏。
两阶段生成:先线稿锁定构图(Phase 5.3),再基于线稿渲染释放风格(Phase 5.5)。
| 模式 | 每场景调用 | 积分 | 空间准确性 | 适用 |
|---|---|---|---|---|
| 快速(--no-sketch) | ~2次 | ~2 | 基准 | 简单/快速迭代 |
| 线稿(默认) | ~3次 | ~3 | +30-50% | 正式制作 |
通用调研能力(全管线可用)
deep-research skill 可在管线任意阶段按需调用。典型场景:Phase 1 人物背景调研、Phase 2 美术风格参考、Phase 3 角色原型参考、Phase 5 场景光影技法、Phase 7 视频生成技术方案。
子 Skill 列表
| Skill | Phase | 功能 |
|---|---|---|
| deep-research | 1.5 | 品牌/人物/受众深度调研 |
| kais-topic-selector | 1.5a | 选题发散(多约束聚合 → 3-5 候选选题 + 6维度预评分) |
| kais-audience | 1.6, 2 | 选题投票筛选 + 剧本预测试(完播率/毒点检测) |
| kais-scenario-writer | 2 | 剧本/分镜编写(对白情感注入) |
| kais-art-direction | 3 | 美术方向/视觉风格定义 |
| kais-character-designer | 4 | 角色设计 + 参考图生成 |
| kais-blender-pose | 4, 6 | 3D 姿态参考图生成(Mixamo 动画帧截取 / 即梦图生图) |
| kais-voice | 4.5 | 语音合成(GLM-TTS 多音色 + 审核选择) |
| kais-scene-designer | 5 | 场景图生成 |
| kais-cinematography-planner | 5.7 | 拍摄手法批量映射(Coverage Map) |
| kais-anatomy-guard | - | 肢体解剖修复守卫(三级防御) |
| kais-storyboard-designer | 6 | 分镜板设计 |
| kais-camera | 7 | 视频生成 + 合成 |
| kais-shooting-script | - | 拍摄脚本生成 |
| kais-review-page | - | 审核页面构建(HTML 交互式预览) |
| kais-story-score | 4, 8.5 | 剧本量化分析(5维度:弧线/情感/角色/节奏/文本) + 质量门控注入 |
共享工具
| 工具 | 路径 | 功能 |
|---|---|---|
| sketch-generator.py | lib/scripts/ | 线稿生成 |
| sketch-to-render.py | lib/scripts/ | 线稿→渲染(四维锚定融合:--style-ref/--lighting/--depth) |
| scene-evaluator.py | lib/scripts/ | 场景图评价(sketch/render/default + 肢体检查 + 深度层次检查) |
| anatomy-validator.py | lib/scripts/ | 解剖质量检测(GLM-4V,hands/face/body/full) |
| jimeng-client.js | lib/ | 即梦 API 客户端(Node.js) |
| cost-scheduler.js | lib/ | 积分/成本调度 |
| extension-chain.js | lib/ | 延长链引擎(buildChainPlan/executeChain/assembleFinal) |
| pipeline.js | lib/ | 管线编排器(串行执行 Phase 1→8,checkpoint/断点恢复) |
| post-production.js | lib/ | 后期合成(字幕生成+音频混流+最终合成) |
| bgm-selector.js | lib/ | BGM 选择(10种风格库,场景情感自动匹配) |
| guard.js | skills/kais-anatomy-guard/lib/ | 肢体解剖修复守卫(negative_prompt + GLM-4V 检测 + 修复) |
| git-stage-manager.js | lib/ | Git 阶段版本管理(checkpoint/rollback/diff) |
| pose-reference.js | lib/hooks/ | 姿态参考图生成(kais-blender-pose 集成,Phase 3/6 hook) |
| 1st-director.js | lib/ | 四维蓝图生成 + 认知走查 + 模因提取 + 熵注入 + 因果闭环(元层) |
| topic-selector-adapter.js | lib/ | 选题发散适配器(聚合四维尺度/6维度门控/受众匹配约束 → LLM生成候选选题) |
- 文生图: 即梦 API (jimeng-5.0)
- 视频生成: Seedance 2.0
- 评价: 智谱 GLM-4V-Flash
- 调研: deep-research skill(品牌/受众/竞品深度调研)
- 合成: FFmpeg
延长链引擎(Extension Chain)
📖 完整 API 见 `references/api-usage.md`
即梦 Seedance 全能参考模式,prompt 中用 @1 @2 @3 @4 描述参考物关系:
- 段1:
@1首帧 +@2目标尾帧 +@3TTS +@4BGM - 段N:
@1段N-1视频 +@2段N尾帧 +@3TTS +@4BGM - 目标尾帧来自分镜
end_frame字段,TTS/BGM 按镜头时间切分
核心函数:buildChainPlan() / buildFilePaths() / buildSeedPrompt() / executeChain() / assembleFinal()
管线编排器(Pipeline)
📖 完整 API 见 `references/api-usage.md`
import { Pipeline } from './lib/pipeline.js';
const pipeline = new Pipeline({ workdir, episode, config, onPhaseComplete, onPhaseFail });
await pipeline.run(); // 执行全部
await pipeline.resume('character'); // 从断点恢复
await pipeline.runPhase('camera', { execute }); // 只执行某阶段Phase 8 后期合成
import { PostProduction } from './lib/post-production.js';
const post = new PostProduction({ workdir, episode });
const result = await post.run({
dialogueLines: [...], videoPath: 'output/rough_cut.mp4',
ttsDir: 'WORKDIR_ASSETS/tts/', bgmPath: 'WORKDIR_ASSETS/bgm/bgm.mp3',
});BGM 选择
import { selectBGMStyle, generateBGMPrompt } from './lib/bgm-selector.js';
const recommendations = selectBGMStyle('英雄站在山顶', '史诗', 30);📖 完整 API 用法(Pipeline / PostProduction / BGM / ExtensionChain)见 `references/api-usage.md`
环境变量
JIMENG_SESSION_ID: 即梦 session IDJIMENG_API_URL: 即梦 API 地址(默认 http://localhost:8000)ZHIPU_API_KEY: 智谱 API Key(GLM-TTS 语音合成)
肢体解剖守卫(kais-anatomy-guard)
三级防御机制,从线稿阶段(Phase 5.3)即开始工作,贯穿渲染阶段(Phase 5.5):
预防层(已集成)
sketch-generator.py 和 sketch-to-render.py 的 negative_prompt 已追加 anatomy 排除词:
bad anatomy, deformed, mutated hands, missing/extra/fused fingers,
extra/missing limbs, bad proportions, distorted/asymmetric face, ...检测层(按需调用)
渲染完成后使用 GLM-4V-Flash 检测解剖问题:
python3 LIB_SCRIPTS/anatomy-validator.py render.png --mode full --threshold 0.6返回 JSON 报告(<image>.anatomy.json),包含 score、issues、negative_boost。
修复层(检测失败时)
基于检测结果增强 negative_prompt + 降低 sample_strength 重试(最多 3 次)。
仍失败则降级:角度调整 / 景深模糊 / 构图裁切。
详见 skills/kais-anatomy-guard/SKILL.md。