开源项目 · 个人主导

AI 驱动的编程式
视频工厂

围绕《玄鉴仙族》,设计并落地 7-Agent AI 工作流,全自动产出人物年鉴竖屏视频。 从素材采集到渲染交付,覆盖 30+ 角色,8 步管线零人工干预。

30+
已完成角色
7
AI Agent 协作
8
全自动工作流步骤
20
自动化质检项
抖音创作者数据中心 LIVE
2026-04-21 至 2026-05-20
77.4万
播放量
▲ 爆发式增长
1.96万
主页访问
1.24万
作品点赞
▲ 点赞率 1.6%
1,407
作品评论
809
作品分享
100%
封面点击率
▲ 行业顶级
+1,148
净增粉丝
▲ 近乎翻倍
1,400
总粉丝量
近 30 天粉丝趋势 · +82% 增长
04-21 04-28 05-05 05-18
01 · Architecture

7-Agent 架构 + 8 步工作流

Orchestrator 主协调,5 个专职 Agent 分工执行,QA Agent 统一质检。每个角色维护独立的状态机。

🎯
Orchestrator
主协调
🔍
SA-Research
素材采集
✍️
SA-Writer
文案撰写
🎙️
SA-Audio
TTS + 字幕
🎬
SA-Video
视频组装
🚀
SA-Publish
渲染交付
QA Agent
统一质检

点击上方 Agent 查看详情

每个 Agent 拥有专属职责、输入输出契约和状态转换规则。

    步骤0 需求确认 步骤1 素材采集 步骤2 文案撰写 步骤3 画面生成 步骤4 创作者审核 步骤5 TTS + 组装 步骤6 统一质检 步骤7 渲染交付
    02 · Video Engine

    Remotion 编程式视频引擎

    基于 React + TypeScript 的编程式视频方案,1080×1920 竖屏,组件化场景系统,主题色变体驱动。

    🎨 设计系统

    画布尺寸1080 × 1920 (9:16)
    字体NotoSerifSC + NotoSansSC
    颜色变体default / danger / gold
    主题色角色专属 Hex 覆盖
    动画系统useDelayedSpring + useDelayedFade
    字幕同步appearAtMs 毫秒级驱动

    🧩 场景组件 (7 种)

    Cover封面标题 + 人设图叠加
    Origin出身背景 + 统计卡片
    TragedyinfoCards + 分屏对比 + 印章
    Timeline时间线滚动 + 事件标注
    Achievement高光时刻 + 统计面板
    Character性格侧写 + 关键词高亮
    Ending尾声总结 + 滚动文本
    Cover 场景
    Cover 场景 · 标题浮现 + 人设图叠加
    Tragedy 场景
    Tragedy 场景 · infoCards 逐张浮现
    Timeline 场景
    Timeline 场景 · 时间线滚动
    // SceneConfig 类型系统 — 所有场景通过配置驱动,零硬编码 export interface SceneConfig { id: string; type: SceneType; // 'cover' | 'origin' | 'tragedy' | ... title: string; mood: string; audioFile: string; subtitles: Subtitle[]; themeColor?: string; // 角色专属主题色 audioDurationMs?: number; // 精确音频时长 infoCards?: InfoCard[]; timeline?: TimelineItem[]; splitCompare?: { ... }; // 分屏对比 keywordHL?: { ... }; // 关键词高亮 seal?: { ... }; // 物理弹跳印章 scrollText?: { ... }; // 底部滚动文本 }
    03 · Quality Engineering

    自动化质检体系

    QA Agent 统一执行 20 项自动化质检,覆盖音频、代码、内容、封面四大维度。不合格自动打回修正。

    音频质检 (5项)
    U-01 音频文件存在且可播放
    U-02 音频时长与字幕匹配
    U-03 发音字典已覆盖生僻字
    U-04 语速在合理范围 (4-8字/秒)
    U-05 音频采样率一致
    代码质检 (6项)
    U-06 TypeScript 编译通过
    U-07 所有场景已注册 Composition
    U-08 appearAtMs 字段完整
    U-09 主题色链路无断链
    U-10 TransitionSeries 帧数正确
    U-11 静态文件路径使用 staticFile()
    内容质检 (6项)
    U-12 字幕与音频文本一致
    U-13 敏感词全量扫描通过
    U-14 视觉组件不重复字幕内容
    U-15 infoCard 为标签式提炼
    U-16 同一场景同句话 ≤ 2 次
    U-17 AIGC 声明已勾选
    封面质检 (3项)
    U-18 封面竖版 3:4 比例
    U-19 封面横版 4:3 比例
    U-20 截帧使用 95% 进度帧

    发音字典四层防御

    数据格式契约的四层防御原则,防止"静默失败"导致关键读音错误。

    1
    消费端容错
    loader 双向适配
    缺失字段降级处理
    2
    消费端断言
    格式损坏时 sys.exit(1)
    阻断错误传播
    3
    生产端契约
    prompt 明确必填字段
    和输出格式规范
    4
    Schema 校验
    JSON Schema 强类型
    校验发音字典结构

    8 套封面模板

    按场景 mood 自动匹配,角色有人设图时自动叠加半透明 portrait。

    ink-mountain
    ink-mountain · 内敛沉稳
    ancestral-hall
    ancestral-hall · 庄重宗族
    cosmic-sword
    cosmic-sword · 仙侠修真
    autumn-rain
    autumn-rain · 悲情哀婉
    golden-throne
    golden-throne · 辉煌权势
    misty-cultivation
    misty-cultivation · 神秘修真
    battlefield-fire
    battlefield-fire · 战火征伐
    twilight-river
    twilight-river · 归隐平和
    04 · Challenges & Solutions

    关键挑战与解决方案

    从实践中提炼的 4 个核心技术故事,展示工程思维与问题拆解能力。

    1

    TransitionSeries 重叠帧导致视频末尾 3-7 秒空白尾帧

    Remotion 的 TransitionSeries 中,相邻场景间的 <Transition duration=15 /> 使前后场景各共享 15 帧重叠。n 个场景有 n-1 个过渡,总重叠帧数 = (n-1) × 15。若 TOTAL_FRAMES 不减去此重叠量,视频末尾会出现空白尾帧。

    空白尾帧 TOTAL_FRAMES 扣除重叠 Remotion
    2

    场景内容溢出导致视觉裁剪与空白间隙

    TragedyScene 下半区同时配置 infoCards + splitCompare + timeline + quote + tags 时,内容超出安全区被裁剪。FadeOutWrapper 在 appearAtMs 到达前仍渲染空 div 占据 flex 空间;SafeZoneGuard 的 flex:'1 1 0' 强制拉伸填满剩余空间;EST_HEIGHTS 估值偏高 15-25% 导致误判超预算。

    视觉溢出 + 空白间隙 FadeOutWrapper return null + 移除 flex 拉伸 + 收紧估值 CSS / React
    3

    "静默失败" — 数据格式损坏无错误输出直接退出

    batch_ask.py 通过 run.py 调用时,questions.json 中未转义的双引号导致 JSON 解析失败,脚本以 exit code 1 静默退出且无错误输出(stderr 未被捕获)。发音字典 loader 曾因不区分"文件不存在"和"文件存在但格式损坏"两种情况,导致后者静默返回 None,TTS 产出看似正常但关键读音错误。

    静默失败 四层防御数据格式契约 Python / 容错设计
    4

    AI 幻觉导致人物辈脉、修为、父亲关系错误传播

    SA-Writer 生成逐字稿时,AI 将"承㞧"误写为"仲脉嫡长系"(应为伯脉),错误传播至 TTS 音频。引入家谱事实校验工具 fact_check.py,对照望月李氏家谱自动检查辈脉、修为、父亲关系,在步骤 4(创作者审核前)自动执行,阻断错误传播。

    AI 幻觉 / 事实错误 家谱事实校验 + 🟢🟡🔴 标注 自动化校验
    05 · Results

    实际运营效果

    近 30 天视频在抖音发布后的粉丝增长与互动数据(2026.04.21 - 2026.05.20)。

    短视频 合集 直播
    数据表现 · 统计周期:2026-04-21 至 2026-05-20
    77.4万
    播放量
    1.96万
    主页访问
    1.24万
    作品点赞
    809
    作品分享
    1,407
    作品评论
    100%
    封面点击率
    1,148
    净增粉丝
    1,400
    总粉丝量
    近30天粉丝趋势
    04-21 04-24 04-27 04-30 05-03 05-06 05-18 1,500 1,200 900 600
    77.4万
    近 30 天总播放量
    单条视频平均播放量 2.5万+,最高单条突破 12万
    +1,148
    净增粉丝(30 天内几乎翻倍)
    封面点击率 100%,说明封面设计系统有效吸引点击
    1.24万
    作品总点赞数
    点赞率 1.6%,高于同类小说解说账号平均水平
    06 · Tech Stack

    技术栈全景

    ⚛️
    Remotion
    编程式视频
    🔷
    TypeScript
    类型安全
    🐍
    Python
    工具链脚本
    📓
    NotebookLM
    素材采集
    🎙️
    MiniMax / XiaoMiMo
    TTS 双引擎
    🎬
    FFmpeg
    视频处理
    🤖
    CodeBuddy Agents
    7-Agent 架构
    ☁️
    AnyDev
    云研发部署
    🧪
    Playwright
    浏览器自动化
    📊
    JSON Schema
    数据契约
    🔧
    Webpack
    构建工具
    📝
    Git
    版本控制
    30+
    已完成角色视频
    20+
    Remotion Composition 注册
    7
    种场景组件复用