AI MANGA DRAMA / PRODUCTION RETROSPECTIVE

重生2013 之我带着
无限Token小龙虾

一部 5 集 AI 漫剧的全流程制作复盘 —— 从剧本到成片,从工具到方法论,从踩坑到最佳实践。供内部团队学习与参考。

5
~12
分钟总时长
80+
视频片段
200+
AI生成任务
8
步标准工作流
成片展示

5 集完整版,全 AI 生成画面 + TTS 配音 + 人工剪辑

重生2013封面
《重生2013 之我带着无限Token小龙虾》全5集 12:31 / 1080p / 2D赛璐珞漫画风
五集叙事弧线
从重生到因果闭环,每一集都在追问同一个命题:AI 的能力边界在哪里?
01
重生
35岁产品经理陈默被裁,带着 Openclaw 无限 Token 系统重生回到 2013 年入职第一天。
02
碾压
校招考核中用 AI 辅助一骑绝尘,DeepSeek 分析县城消费心理,赢得入职机会。
03
帝国
多模型协同打造拼少少和抖歌两大产品线,季度 GMV 127 亿,日活增长 3.2 亿。
04
总办之争
业绩碾压但人心失败。数据从来不是答案 —— AI 帮你赢得业务,赢不了人心。9:3 落败。
05
因果
胜利的空虚,被裁员工的镜像对照。因果守恒 —— 你裁掉的每一个人,都可能带着无限 Token 回来。
核心命题:"如果你拥有无限的 AI 算力和预知未来的能力,你能改变自己的命运吗?"
故事探讨的不是 AI 有多强,而是 AI 的能力边界在哪里。技术碾压带来的不是确定性的胜利,而是对"确定性"本身的傲慢。
8 步标准制作流程
从第四集 24 个镜头组的实战中沉淀,在第五集验证升级,覆盖从剧本到配音的全链路。
STEP 01
剧本核心提取 + 视觉可执行性检查
把文学性剧本翻译成可执行的分镜描述。不是"提取"剧本,而是"翻译"剧本。
空间描述明确 人物朝向清晰 隐喻具象化 时间跳跃补过渡
STEP 02
资产准备(角色 / 场景 / 道具)
关键帧生成前必须完成。角色引用 role_id,场景匹配目标视角,内容性道具先生成参考图确认准确性。
角色多视图 场景视角匹配 高频道具独立资产化 命名规范区分
STEP 03
空间逻辑检查(两阶段)
剧本提取时预防性检查,关键帧阶段校验性检查。三要素硬检查:人物朝向、纵深层次、背景锚点。
人物朝向 纵深层次 背景锚点
STEP 04
文字渲染风险矩阵 + 人工复查
AI 视频文字渲染极其不稳定。按字符数和类型三级分险,出提示词时人工判断是否保留。
4字符以内尝试 5-10字符谨慎 10字符以上禁止
STEP 05
镜头拆分判据
三判据任一成立即拆:景别跳切、运动方向反转、构图主体切换。拆分后单段不低于 5 秒。
景别跳切 运动反转 主体切换 空间连续性
STEP 06
内容分工原则
配音负责"说了什么"(内容含义),画面负责"看起来怎样"(视觉冲击)。需要"读"的交配音,只需"看"的交画面。
配音 = 含义 画面 = 视觉
STEP 07
选版质量门控
每镜头 x2 版本择优。三检查清单:角色一致性、空间逻辑正确性、视觉基调匹配度。
角色一致性 空间逻辑 视觉基调
STEP 08
配音参数一致性
同角色在所有镜头使用相同 TTS 声音参数。首次出场定义,后续引用,不得随意变更。
同角色同音色 参数表维护
AI 工具链
三层架构:内容创作层、制作管理层、后期制作层,覆盖从剧本到成片的全流程。
C

内容创作

  • Claude — 剧本撰写、分镜设计、提示词工程
  • 贝宝 (316) — 角色设定图、场景/道具资产
  • Seedance 2.0 — 全部视频片段,主体参考+音画同步
  • MiniMax TTS — 角色配音,speech-2.8-hd
W

制作管理

  • WorkRally 无限画布 — 素材管理、版本选优
  • WorkRally CLI — 批量生成、资产入库
  • CodeBuddy (Claude Code) — 全流程自动化脚本
P

后期制作

  • 剪映 — 视频剪辑、硬切拼接、音效铺设
  • Remotion — 字幕层渲染(解决文字乱码)

单集制作流水线

剧本翻译 资产准备 提示词撰写 批量生成 x2 画布选版 TTS 配音 剪辑合成
核心方法论
从 200+ 次生成任务中提炼的实操规范。

EMOTION → PIXEL 噪音过滤

提示词撰写的核心原则:每个词都要能翻译成像素,不能翻译的就是噪音。

情绪意图 生理反应 肌肉/体态状态 像素描述

三问检查:可见?可执行?必要?任一为否 → 删掉或改写

五大致命模式:隐喻替换、情绪命名、摄影参数堆砌、叙述评价、空洞氛围词

典型案例:Shot14A 原版 800 字 → 过滤后 250 字有效信息,70% 是噪音

字数纪律

片段时长字数上限
5-6 秒≤ 250 字
9 秒≤ 350 字
15 秒≤ 450 字

文字渲染风险矩阵

字符数风险等级操作
≤ 4字符● 可渲染尝试保留
5-10字符● 谨慎关键帧试渲染
> 10字符● 禁止全部交配音

提示词结构规范

五段结构,单段连续流描述:

Scene 场景 Atmosphere 氛围 FirstFrame 首帧 VideoDesc 运动 EndFrame 尾帧

ID 引用语法:直接紧跟名称,不用 @ 前缀。如 法务部中年人7s1e1iebe6

配音格式:台词(角色声音特征):"内容" | 仅配音,不配音效

角色资产体系
8 个核心角色,每个角色有独立参考图和声音参数定义。
陈默
主角 / 35岁产品经理

男声,语调平稳自信,条理清晰

钱玉
竞争对手 / 38岁干练女性

女声,干练利落

法务部中年人
质疑者

男声,质问语气

风控部人员
冷静审查

男声,冷静理性

HR
HR BP
公事公办

女声,公事公办

技术总监
疲惫的支持者

男声,疲惫但坚定

产品经理
冷峻旁观

女声,冷峻克制

中年男人
被裁员工 / 镜像对照

40+岁,驼背,背影为主

制作数据一览
整部作品的关键数字。
80+
总视频片段
~200
视频生成任务
~100
图片生成任务
8
角色资产(含多视图)
18
场景资产
12
道具资产
1 天
单集最快制作周期
3-4x
效率提升(首集到末集)

第五集生成成功率 vs 视频时长

Seedance 2.0 最低稳定时长为 4 秒,短于此基本全军覆没

成功率与时长关系图表
失败 成功
踩坑实录
制作过程中遇到的核心问题和解决方案,按严重程度排列。
P0 最严重 Seedance 2.0 时长门槛
现象:1s 成功率 0/10,2s 成功率 0/2,3s 成功率 1/7,而 4s+ 成功率 16/16(100%)。
根因:SubjectToVideo 模式下,模型需要足够帧数建立主体参考与视频运动的映射关系,3s(72帧@24fps)是临界点。
解决:所有片段最低时长设 4s,1-3s 闪切需求用 4s 素材后期加速实现。
教训:以后所有片段最低时长 4s,不再直接提交短时长。
P1 耗时 中年男人角色迭代
迭代:默认生成 → 无限画布精修 → 暖黄台灯版(3 轮迭代)
关键决策:从"蓝光唯一光源+墙面斑驳"改为"暖黄台灯+冷光对比",冷暖对比更符合叙事意图。
教训:角色设定图必须先在无限画布上跑一轮,确认姿态/光影后再用于视频 prompt。
P1 浪费 音效未前置开启
现象:初始 36 个任务全部未开 --enable-sound,视频完全无声。
解决:用户自行重跑时全部加上 --enable-sound,并补写音效描述。
教训:音效开关应第一批提交时就打开。AI 环境音作底噪,后期精确音效再叠加。
P2 已解决 AR 界面文字干扰
现象:含文字的 AR 界面资产做背景呼吸时,文字被错误渲染。
解决:生成三版 AR 界面(有文字 → 无文字图标 → 空白框架),按需选用。
教训:内容性道具必须先出独立参考图,不能用带文字的资产兼任纯视觉背景。
P2 已解决 WorkRally 搜索服务不稳定
现象:asset_search CLI 频繁 999 错误,缓存只返回最近约 20 个资产。
解决:改用 tools call asset_search + channel: ["toolbox_canvas"] 数组格式。
教训:CLI search 子命令不可靠,批量搜索走 tools call 接口更稳。搜索不到时用 asset get 直接查。
创作心得
从第一集摸索到第五集高效流水线,最大的变化不是工具变了,而是工作流沉淀了。

AI 视频的能力边界

擅长:固定机位、单一主体动作、光影氛围渲染、抽象视觉效果
不擅长:跳切蒙太奇、文字渲染、多人交互、镜面反射

工作流沉淀的价值

从第一集的摸索到第五集的高效流水线,一套经过验证的 8 步流程让单集产出效率提升了 3-4 倍。Workflow 是活文档,随项目经验持续更新。

人机协作的体会

AI 可以生成每一帧画面,但叙事节奏、情感转折、台词打磨仍然需要人的判断。这部作品本身就是关于 AI 能力边界的故事,制作过程也在不断验证这个命题。

提示词是工程,不是文学

EMOTION → PIXEL 规范的核心:每个词都要能翻译成像素。70% 的初始提示词是噪音。写提示词像写代码,不像写小说。

资产管理决定效率天花板

角色多视图 → 场景视角匹配 → 高频道具独立资产化 → 命名规范。资产准备越充分,生成成功率越高,返工越少。

选版不能跳过

每镜头 x2 版本择优不只是"挑好看的",而是在确认角色一致性、空间逻辑和视觉基调。这是最关键的质量门控环节,不能自动化。

关于"因果守恒":这部作品的终极命题 —— AI 可以帮你做出完美的数据决策,但做不了"人"的决策。你裁掉的每一个人,都可能带着无限 Token 回来。因果是守恒的。
制作时间线
从创意到成片的关键节点。
04-14
创意诞生
评审 30+ 个创意后选定"重生 2013 无限 Token",完成 5 分钟剧本大纲。同日完成剧本 V3 深度升级。
04-16 ~ 04-20
角色与世界观搭建
角色设定图生成、多视图制作、场景资产体系搭建、WorkRally 画布配置。
04-21 ~ 04-22
Workflow v1.0 + 方法论沉淀
EMOTION→PIXEL 噪音检查规范确立,提示词结构五段式定型,中文提示词优于英文实操验证。
04-23
第四集 24 镜头 + 第五集全流程
第四集镜头组全部完成,第五集单日高密度产出(18 片段 x2 版本),Workflow 升级至 v2.0。
04-29
后期制作 + 过渡镜头
第 2→3 集过渡镜头设计(工位进化跳切蒙太奇),台词精调,封面海报生成,作品说明文档撰写。
04-30
全流程复盘上线
制作全流程可视化复盘页面,部署内部服务器供团队学习。