重生2013 - AI漫剧制作全流程复盘

Story Arc

五集叙事弧线

从重生到因果闭环，每一集都在追问同一个命题：AI 的能力边界在哪里？

重生

35岁产品经理陈默被裁，带着 Openclaw 无限 Token 系统重生回到 2013 年入职第一天。

碾压

校招考核中用 AI 辅助一骑绝尘，DeepSeek 分析县城消费心理，赢得入职机会。

帝国

多模型协同打造拼少少和抖歌两大产品线，季度 GMV 127 亿，日活增长 3.2 亿。

总办之争

业绩碾压但人心失败。数据从来不是答案 —— AI 帮你赢得业务，赢不了人心。9:3 落败。

因果

胜利的空虚，被裁员工的镜像对照。因果守恒 —— 你裁掉的每一个人，都可能带着无限 Token 回来。

核心命题："如果你拥有无限的 AI 算力和预知未来的能力，你能改变自己的命运吗？"
故事探讨的不是 AI 有多强，而是 AI 的能力边界在哪里。技术碾压带来的不是确定性的胜利，而是对"确定性"本身的傲慢。

Workflow v2.0

8 步标准制作流程

从第四集 24 个镜头组的实战中沉淀，在第五集验证升级，覆盖从剧本到配音的全链路。

STEP 01

剧本核心提取 + 视觉可执行性检查

把文学性剧本翻译成可执行的分镜描述。不是"提取"剧本，而是"翻译"剧本。

空间描述明确人物朝向清晰隐喻具象化时间跳跃补过渡

STEP 02

资产准备（角色 / 场景 / 道具）

关键帧生成前必须完成。角色引用 role_id，场景匹配目标视角，内容性道具先生成参考图确认准确性。

角色多视图场景视角匹配高频道具独立资产化命名规范区分

STEP 03

空间逻辑检查（两阶段）

剧本提取时预防性检查，关键帧阶段校验性检查。三要素硬检查：人物朝向、纵深层次、背景锚点。

人物朝向纵深层次背景锚点

STEP 04

文字渲染风险矩阵 + 人工复查

AI 视频文字渲染极其不稳定。按字符数和类型三级分险，出提示词时人工判断是否保留。

4字符以内尝试 5-10字符谨慎 10字符以上禁止

STEP 05

镜头拆分判据

三判据任一成立即拆：景别跳切、运动方向反转、构图主体切换。拆分后单段不低于 5 秒。

景别跳切运动反转主体切换空间连续性

STEP 06

内容分工原则

配音负责"说了什么"（内容含义），画面负责"看起来怎样"（视觉冲击）。需要"读"的交配音，只需"看"的交画面。

配音 = 含义画面 = 视觉

STEP 07

选版质量门控

每镜头 x2 版本择优。三检查清单：角色一致性、空间逻辑正确性、视觉基调匹配度。

角色一致性空间逻辑视觉基调

STEP 08

配音参数一致性

同角色在所有镜头使用相同 TTS 声音参数。首次出场定义，后续引用，不得随意变更。

同角色同音色参数表维护

Tool Chain

AI 工具链

三层架构：内容创作层、制作管理层、后期制作层，覆盖从剧本到成片的全流程。

内容创作

Claude — 剧本撰写、分镜设计、提示词工程
贝宝 (316) — 角色设定图、场景/道具资产
Seedance 2.0 — 全部视频片段，主体参考+音画同步
MiniMax TTS — 角色配音，speech-2.8-hd

制作管理

WorkRally 无限画布 — 素材管理、版本选优
WorkRally CLI — 批量生成、资产入库
CodeBuddy (Claude Code) — 全流程自动化脚本

后期制作

剪映 — 视频剪辑、硬切拼接、音效铺设
Remotion — 字幕层渲染（解决文字乱码）

单集制作流水线

剧本翻译 → 资产准备 → 提示词撰写 → 批量生成 x2 → 画布选版 → TTS 配音 → 剪辑合成

Core Methodology

核心方法论

从 200+ 次生成任务中提炼的实操规范。

EMOTION → PIXEL 噪音过滤

提示词撰写的核心原则：每个词都要能翻译成像素，不能翻译的就是噪音。

情绪意图 → 生理反应 → 肌肉/体态状态 → 像素描述

三问检查：可见？可执行？必要？任一为否 → 删掉或改写

五大致命模式：隐喻替换、情绪命名、摄影参数堆砌、叙述评价、空洞氛围词

典型案例：Shot14A 原版 800 字 → 过滤后 250 字有效信息，70% 是噪音

字数纪律

片段时长	字数上限
5-6 秒	≤ 250 字
9 秒	≤ 350 字
15 秒	≤ 450 字

文字渲染风险矩阵

字符数	风险等级	操作
≤ 4字符	● 可渲染	尝试保留
5-10字符	● 谨慎	关键帧试渲染
> 10字符	● 禁止	全部交配音

提示词结构规范

五段结构，单段连续流描述：

Scene 场景 Atmosphere 氛围 FirstFrame 首帧 VideoDesc 运动 EndFrame 尾帧

ID 引用语法：直接紧跟名称，不用 @ 前缀。如 法务部中年人7s1e1iebe6

配音格式：台词（角色声音特征）："内容" | 仅配音，不配音效

Characters

角色资产体系

8 个核心角色，每个角色有独立参考图和声音参数定义。

陈

陈默

主角 / 35岁产品经理

男声，语调平稳自信，条理清晰

钱

钱玉

竞争对手 / 38岁干练女性

女声，干练利落

法

法务部中年人

质疑者

男声，质问语气

风

风控部人员

冷静审查

男声，冷静理性

HR BP

公事公办

女声，公事公办

技

技术总监

疲惫的支持者

男声，疲惫但坚定

产

产品经理

冷峻旁观

女声，冷峻克制

中

中年男人

被裁员工 / 镜像对照

40+岁，驼背，背影为主

Pitfalls & Solutions

踩坑实录

制作过程中遇到的核心问题和解决方案，按严重程度排列。

P0 最严重 Seedance 2.0 时长门槛

现象：1s 成功率 0/10，2s 成功率 0/2，3s 成功率 1/7，而 4s+ 成功率 16/16（100%）。
根因：SubjectToVideo 模式下，模型需要足够帧数建立主体参考与视频运动的映射关系，3s（72帧@24fps）是临界点。
解决：所有片段最低时长设 4s，1-3s 闪切需求用 4s 素材后期加速实现。
教训：以后所有片段最低时长 4s，不再直接提交短时长。

P1 耗时中年男人角色迭代

迭代：默认生成 → 无限画布精修 → 暖黄台灯版（3 轮迭代）
关键决策：从"蓝光唯一光源+墙面斑驳"改为"暖黄台灯+冷光对比"，冷暖对比更符合叙事意图。
教训：角色设定图必须先在无限画布上跑一轮，确认姿态/光影后再用于视频 prompt。

P1 浪费音效未前置开启

现象：初始 36 个任务全部未开 --enable-sound，视频完全无声。
解决：用户自行重跑时全部加上 --enable-sound，并补写音效描述。
教训：音效开关应第一批提交时就打开。AI 环境音作底噪，后期精确音效再叠加。

P2 已解决 AR 界面文字干扰

现象：含文字的 AR 界面资产做背景呼吸时，文字被错误渲染。
解决：生成三版 AR 界面（有文字 → 无文字图标 → 空白框架），按需选用。
教训：内容性道具必须先出独立参考图，不能用带文字的资产兼任纯视觉背景。

P2 已解决 WorkRally 搜索服务不稳定

现象：asset_search CLI 频繁 999 错误，缓存只返回最近约 20 个资产。
解决：改用 tools call asset_search + channel: ["toolbox_canvas"] 数组格式。
教训：CLI search 子命令不可靠，批量搜索走 tools call 接口更稳。搜索不到时用 asset get 直接查。

Key Takeaways

创作心得

从第一集摸索到第五集高效流水线，最大的变化不是工具变了，而是工作流沉淀了。

AI 视频的能力边界

擅长：固定机位、单一主体动作、光影氛围渲染、抽象视觉效果
不擅长：跳切蒙太奇、文字渲染、多人交互、镜面反射

工作流沉淀的价值

从第一集的摸索到第五集的高效流水线，一套经过验证的 8 步流程让单集产出效率提升了 3-4 倍。Workflow 是活文档，随项目经验持续更新。

人机协作的体会

AI 可以生成每一帧画面，但叙事节奏、情感转折、台词打磨仍然需要人的判断。这部作品本身就是关于 AI 能力边界的故事，制作过程也在不断验证这个命题。

提示词是工程，不是文学

EMOTION → PIXEL 规范的核心：每个词都要能翻译成像素。70% 的初始提示词是噪音。写提示词像写代码，不像写小说。

资产管理决定效率天花板

角色多视图 → 场景视角匹配 → 高频道具独立资产化 → 命名规范。资产准备越充分，生成成功率越高，返工越少。

选版不能跳过

每镜头 x2 版本择优不只是"挑好看的"，而是在确认角色一致性、空间逻辑和视觉基调。这是最关键的质量门控环节，不能自动化。

关于"因果守恒"：这部作品的终极命题 —— AI 可以帮你做出完美的数据决策，但做不了"人"的决策。你裁掉的每一个人，都可能带着无限 Token 回来。因果是守恒的。

Timeline

制作时间线

从创意到成片的关键节点。

04-14

创意诞生

评审 30+ 个创意后选定"重生 2013 无限 Token"，完成 5 分钟剧本大纲。同日完成剧本 V3 深度升级。

04-16 ~ 04-20

角色与世界观搭建

角色设定图生成、多视图制作、场景资产体系搭建、WorkRally 画布配置。

04-21 ~ 04-22

Workflow v1.0 + 方法论沉淀

EMOTION→PIXEL 噪音检查规范确立，提示词结构五段式定型，中文提示词优于英文实操验证。

04-23

第四集 24 镜头 + 第五集全流程

第四集镜头组全部完成，第五集单日高密度产出（18 片段 x2 版本），Workflow 升级至 v2.0。

04-29

后期制作 + 过渡镜头

第 2→3 集过渡镜头设计（工位进化跳切蒙太奇），台词精调，封面海报生成，作品说明文档撰写。

04-30

全流程复盘上线

制作全流程可视化复盘页面，部署内部服务器供团队学习。

重生2013 之我带着
无限Token小龙虾