学员实践:openbili AI 接入驾驶舱介绍
Calvin 是「翔宇工作流」的学员,方向是 AI 模型中转。他把这件事做成了独立站点「openbili」,覆盖 OpenAI SDK 兼容、模型路由、调用成本可见、失败可解释。本文将其介绍给关注同方向的读者。
免费升级版 n8n 爆款短视频工作流,在视频 33 基础上新增旁白配音、智能字幕和多版本输出三大能力。输入文案和参考视频后 AI 团队自动完成剧本改写、风格化图片生成、多版本配音和视频合成。教程涵盖 Qwen TTS 多音色配音配置、ASS 字幕样式自定义、分辨率自适应合成和 AB 测试多版本输出策略,适合自媒体短视频批量生产。
视频 33 实现了纯视觉冲击的感官类短视频,视频 34 实现了对已有视频的二次剪辑解说。那如果我想从一段文字开始,直接生成一条带旁白、带配音、带风格化画面的短视频呢?
我是翔宇。翔宇在视频 33 和 34 的基础上持续迭代,这次升级的三大能力都是实际生产中最迫切需要的。
这就是视频 36 要解决的问题。这是一套在视频 33 基础上全面升级的爆款短视频工作流——你提供一份文案和一个参考视频,AI 团队自动完成剧本改写、风格化图片生成、多版本配音和视频合成。最大的升级点有三个:加入了旁白解说能力,集成了三个不同的视频生成平台(fal.ai、ComfyUI、NCA),以及 NCA 链路完全免费。
从小说改编到评书三国,从霸总言情到玄幻仙侠,从宗教寓言到动物世界——只要你能想到的风格,LibLib 平台的十万个 LoRA 模型都能帮你实现。
本教程配套视频已发布在 YouTube,建议搭配视频一起学习效果更佳。
我在之前的视频中建立了一套短视频分类体系:
感官层(视频 33):高质量的视觉和听觉直接抓住注意力,没有文字旁白,靠画面冲击。
情节层(视频 34/36):加入对话、旁白和解说,让短视频更具戏剧感和代入感。视频 34 是对已有视频的二次剪辑,视频 36 是从文案出发全新生成。
理念层(未来方向):在视觉和情节基础上融入价值观和理念,打动人心、引发共鸣。这需要更强的 AI 视频生成能力,目前还在探索中。
今天这套工作流补全了从"AI 生成素材 + 旁白功能"这个组合,让你能真正地把一段文字变成一条完整的短视频。
这套工作流集成了三个不同的视频生成平台,满足不同预算和质量需求:
fal.ai:支持市面上几乎所有公开的视频模型,画面质量高,按量计费。适合对画面要求高、预算充足的场景。
ComfyUI 云平台:专业版的图生视频工具,通过订阅制使用。适合需要精细控制画面效果的专业用户。
NCA 免费链路:使用 NCA 开源项目实现图片到视频的转换——通过 PPT 式的缩放和平移让静态图片产生动态效果。完全免费,适合以文案为主、画面为辅的小说类和故事类短视频。
第一步:需求输入。 表单中填写五个字段——视频文案(长文本)、参考视频链接(用于学习旁白风格)、分镜数量(5-8 个)、视频语言、视频平台(三选一)。文案和参考视频都使用直链,避免在 n8n 中处理大文件。
第二步:Gemini 剧本生成。 将参考视频和文案一起发送给 Gemini 2.5 Pro,它会分析参考视频的画面风格和旁白方式,然后按照你的文案内容生成完整的分镜脚本——每个分镜包含旁白文案和图片生成提示词。工作流内置了智能字数判断:不同视频平台的分镜时长不同,旁白字数会自动适配。
第三步:风格化图片生成。 遍历每个分镜,调用 LibLib 平台生成风格化图片。这里的关键是 LoRA 模型——它就像一个"风格画师",能给画面施加特定的艺术风格。三国水墨风、赛博朋克、日系动漫、欧美写实,任何你想要的风格都能找到对应的 LoRA。
第四步:配音生成与音画同步。 Fish Audio 根据旁白文案生成配音。和视频 34 一样使用三版本择优机制——三个不同字数的旁白版本同时生成配音,选择时长最接近画面的那个,再通过视频调速实现毫秒级同步。
第五步:视频合成与拼接。 根据选择的平台(fal.ai/ComfyUI/NCA)将图片转换为视频片段,与配音合成后全片拼接,添加背景音乐,输出最终视频。
LibLib 是这套工作流的图片生成引擎。选择 LoRA 的方法很简单:
一个重要的建议:每条短视频的所有分镜应该使用同一个 LoRA,保持视觉风格一致。如果想实现人物一致性,可以在 LibLib 上用自己的角色图片训练一个专属 LoRA。
工作流支持"参考视频风格迁移"功能——你输入一个抖音爆款视频的链接,Gemini 会分析这个视频的旁白风格(用词习惯、句式节奏、语气特点),然后把你的原始文案按照这个风格重新改写。
这意味着你可以模仿任何你喜欢的博主的旁白风格,生成属于自己的内容。当然,最终还是要注入你的独特创意和观点——模板只是起点。
我用这套工作流测试了十几种不同风格的短视频:
所有效果展示的文案、参考视频、配乐、音色和 LoRA 链接都已整理在官网效果页面,方便复刻。
效果展示详见:工作流效果页面
Q:为什么推荐云端部署而不是本地?
两个原因。第一,4090/5090 的价格很高,而且已经砍了显存,本地部署的性价比不高。第二,本地环境容易因为软件更新、环境变量修改等原因导致工作流出错。云端几千块钱一年就够用,稳定性远胜本地。
Q:NCA 免费链路的画面效果如何?
NCA 链路是通过图片的 PPT 式缩放和平移来实现动态效果的,画面不会有真正的动作。对于小说解说、故事类短视频来说完全够用——因为在这类内容中,配音和文案才是主角,画面是辅助。
Q:一条短视频的成本是多少?
NCA 链路:几乎为零(Gemini 免费额度 + Fish Audio 几分钱)。fal.ai 链路:根据模型和时长不同,单条约几毛到几块钱。ComfyUI 链路:取决于订阅方案。
这套工作流和视频 33、34 一起,构成了一个完整的短视频生产体系——从纯视觉冲击(33),到已有视频二次剪辑(34),再到文案驱动的全新视频生成(36)。三套工作流覆盖了短视频创作的主要场景。
但工作流只是模板,你的创意和风格才是真正的护城河。短视频赛道的内容过时速度很快,能维于不败之地的只有独特性。拿到工作流后,在我的基础上注入你自己的 LoRA 风格、你自己的配音、你自己的文案——那才是真正属于你的爆款。
下一期我们将进入大模型微调领域——通过 n8n 自动化 Gemini 微调,让 AI 写出带有你独特 IP 风格的文章。
每周精选 AI 编程与自动化实战内容,直达你的邮箱