n8n 36. 免费!万种风格 n8n 爆款短视频工作流全面升级,自媒体必看

免费升级版 n8n 爆款短视频工作流,在视频 33 基础上新增旁白配音、智能字幕和多版本输出三大能力。输入文案和参考视频后 AI 团队自动完成剧本改写、风格化图片生成、多版本配音和视频合成。教程涵盖 Qwen TTS 多音色配音配置、ASS 字幕样式自定义、分辨率自适应合成和 AB 测试多版本输出策略,适合自媒体短视频批量生产。

n8n 36. 免费!万种风格 n8n 爆款短视频工作流全面升级,自媒体必看

引言

视频 33 实现了纯视觉冲击的感官类短视频,视频 34 实现了对已有视频的二次剪辑解说。那如果我想从一段文字开始,直接生成一条带旁白、带配音、带风格化画面的短视频呢?

我是翔宇。翔宇在视频 33 和 34 的基础上持续迭代,这次升级的三大能力都是实际生产中最迫切需要的。

这就是视频 36 要解决的问题。这是一套在视频 33 基础上全面升级的爆款短视频工作流——你提供一份文案和一个参考视频,AI 团队自动完成剧本改写、风格化图片生成、多版本配音和视频合成。最大的升级点有三个:加入了旁白解说能力,集成了三个不同的视频生成平台(fal.ai、ComfyUI、NCA),以及 NCA 链路完全免费。

从小说改编到评书三国,从霸总言情到玄幻仙侠,从宗教寓言到动物世界——只要你能想到的风格,LibLib 平台的十万个 LoRA 模型都能帮你实现。

你将学到

  • 组建 AI 团队协作:Gemini 写剧本、LibLib 画图、Fish Audio 配音、NCA/fal.ai/ComfyUI 生成视频
  • 利用 LibLib 平台的 10 万+ LoRA 模型实现无限风格切换
  • 三条视频生成链路的选型与搭建:fal.ai(付费高质量)、ComfyUI(专业可控)、NCA(完全免费)
  • 风格化迁移:输入参考视频链接,AI 自动学习旁白风格并迁移到你的文案
  • 动态旁白字数策略:根据不同视频平台自动调整分镜旁白长度
  • 秒级音画同步的择优配音机制
  • Fish Audio 20 万音色库的实战使用

视频教程

本教程配套视频已发布在 YouTube,建议搭配视频一起学习效果更佳。

详细教程

短视频分类体系与工作流定位

我在之前的视频中建立了一套短视频分类体系:

感官层(视频 33):高质量的视觉和听觉直接抓住注意力,没有文字旁白,靠画面冲击。

情节层(视频 34/36):加入对话、旁白和解说,让短视频更具戏剧感和代入感。视频 34 是对已有视频的二次剪辑,视频 36 是从文案出发全新生成。

理念层(未来方向):在视觉和情节基础上融入价值观和理念,打动人心、引发共鸣。这需要更强的 AI 视频生成能力,目前还在探索中。

今天这套工作流补全了从"AI 生成素材 + 旁白功能"这个组合,让你能真正地把一段文字变成一条完整的短视频。

三条视频生成链路

这套工作流集成了三个不同的视频生成平台,满足不同预算和质量需求:

fal.ai:支持市面上几乎所有公开的视频模型,画面质量高,按量计费。适合对画面要求高、预算充足的场景。

ComfyUI 云平台:专业版的图生视频工具,通过订阅制使用。适合需要精细控制画面效果的专业用户。

NCA 免费链路:使用 NCA 开源项目实现图片到视频的转换——通过 PPT 式的缩放和平移让静态图片产生动态效果。完全免费,适合以文案为主、画面为辅的小说类和故事类短视频。

工作流核心流程

第一步:需求输入。 表单中填写五个字段——视频文案(长文本)、参考视频链接(用于学习旁白风格)、分镜数量(5-8 个)、视频语言、视频平台(三选一)。文案和参考视频都使用直链,避免在 n8n 中处理大文件。

第二步:Gemini 剧本生成。 将参考视频和文案一起发送给 Gemini 2.5 Pro,它会分析参考视频的画面风格和旁白方式,然后按照你的文案内容生成完整的分镜脚本——每个分镜包含旁白文案和图片生成提示词。工作流内置了智能字数判断:不同视频平台的分镜时长不同,旁白字数会自动适配。

第三步:风格化图片生成。 遍历每个分镜,调用 LibLib 平台生成风格化图片。这里的关键是 LoRA 模型——它就像一个"风格画师",能给画面施加特定的艺术风格。三国水墨风、赛博朋克、日系动漫、欧美写实,任何你想要的风格都能找到对应的 LoRA。

第四步:配音生成与音画同步。 Fish Audio 根据旁白文案生成配音。和视频 34 一样使用三版本择优机制——三个不同字数的旁白版本同时生成配音,选择时长最接近画面的那个,再通过视频调速实现毫秒级同步。

第五步:视频合成与拼接。 根据选择的平台(fal.ai/ComfyUI/NCA)将图片转换为视频片段,与配音合成后全片拼接,添加背景音乐,输出最终视频。

LibLib 平台与 LoRA 选择

LibLib 是这套工作流的图片生成引擎。选择 LoRA 的方法很简单:

  1. 进入 LibLib 平台,筛选条件选"LoRA",搭配模型选"Flux F1"
  2. 按"最多运行"排序,找到最受欢迎的风格
  3. 点击进入 LoRA 详情页,复制编号填入工作流的设置参数

一个重要的建议:每条短视频的所有分镜应该使用同一个 LoRA,保持视觉风格一致。如果想实现人物一致性,可以在 LibLib 上用自己的角色图片训练一个专属 LoRA。

风格化迁移的实现

工作流支持"参考视频风格迁移"功能——你输入一个抖音爆款视频的链接,Gemini 会分析这个视频的旁白风格(用词习惯、句式节奏、语气特点),然后把你的原始文案按照这个风格重新改写。

这意味着你可以模仿任何你喜欢的博主的旁白风格,生成属于自己的内容。当然,最终还是要注入你的独特创意和观点——模板只是起点。

效果展示

我用这套工作流测试了十几种不同风格的短视频:

  • 橘猫日常:搞笑配音 + 萌宠 LoRA,适合抖音宠物赛道
  • 悬疑故事:阴暗画风 + 紧张节奏的旁白,古井鬼故事的沉浸感
  • 评书三国:水墨三国 LoRA + 评书大师配音,赤壁之战的豪迈感扑面而来
  • 霸总言情:都市风格 LoRA + 女声旁白,适合小说改编赛道
  • 玄幻仙侠:仙侠画风 LoRA + 配乐渲染,修仙文案一键成片
  • 佛学寓言:禅意画风 + 低沉男声,适合情感类短视频
  • 王家卫风格:独特色调 LoRA + 文艺配乐,氛围感拉满
  • 动物世界、童年旁白、恐怖小说等多种场景

所有效果展示的文案、参考视频、配乐、音色和 LoRA 链接都已整理在官网效果页面,方便复刻。

效果展示详见:工作流效果页面

常见问题

Q:为什么推荐云端部署而不是本地?
两个原因。第一,4090/5090 的价格很高,而且已经砍了显存,本地部署的性价比不高。第二,本地环境容易因为软件更新、环境变量修改等原因导致工作流出错。云端几千块钱一年就够用,稳定性远胜本地。

Q:NCA 免费链路的画面效果如何?
NCA 链路是通过图片的 PPT 式缩放和平移来实现动态效果的,画面不会有真正的动作。对于小说解说、故事类短视频来说完全够用——因为在这类内容中,配音和文案才是主角,画面是辅助。

Q:一条短视频的成本是多少?
NCA 链路:几乎为零(Gemini 免费额度 + Fish Audio 几分钱)。fal.ai 链路:根据模型和时长不同,单条约几毛到几块钱。ComfyUI 链路:取决于订阅方案。

总结

这套工作流和视频 33、34 一起,构成了一个完整的短视频生产体系——从纯视觉冲击(33),到已有视频二次剪辑(34),再到文案驱动的全新视频生成(36)。三套工作流覆盖了短视频创作的主要场景。

但工作流只是模板,你的创意和风格才是真正的护城河。短视频赛道的内容过时速度很快,能维于不败之地的只有独特性。拿到工作流后,在我的基础上注入你自己的 LoRA 风格、你自己的配音、你自己的文案——那才是真正属于你的爆款。

下一期我们将进入大模型微调领域——通过 n8n 自动化 Gemini 微调,让 AI 写出带有你独特 IP 风格的文章。

资源下载

订阅成功!请到邮箱查收确认链接。

订阅成功!请到邮箱查收确认链接。

订阅成功!请到邮箱查收确认链接。

订阅成功!请到邮箱查收确认链接。

操作成功。

操作已取消。