学员实践:openbili AI 接入驾驶舱介绍
Calvin 是「翔宇工作流」的学员,方向是 AI 模型中转。他把这件事做成了独立站点「openbili」,覆盖 OpenAI SDK 兼容、模型路由、调用成本可见、失败可解释。本文将其介绍给关注同方向的读者。
用 Make.com 和 Flux 图像模型三分钟生成图文并茂的儿童绘本。从 Notion 输入主题后工作流自动完成故事创作、分镜设计、Flux 风格化配图生成和图文混排。教程涵盖 Flux 模型的 LoRA 风格控制、一致性角色提示词编写、图文排版 HTML 模板设计和公众号直发格式适配,零基础也能批量生产风格统一的精美绘本内容。
我一直在想,能不能用自动化把内容创作的边界推到图文并茂这个层面——不只是生成文字,连配图都一起搞定。儿童绘本是一个很好的切入点:故事结构简单、风格统一、图文配合紧密,非常适合用工作流来自动化。
我是翔宇。翔宇测试了多种 AI 图文创作方案后发现,Flux 配合 LoRA 在风格一致性上远超其他工具。
这期我搭建了一个完整的儿童插画绘本生成工作流。从 Notion 输入一个主题(比如"小老虎和小蛇的探险故事"),3 分钟后就能拿到一本风格统一、图文混排的绘本,直接可以发公众号。整个过程涵盖故事创作、角色设计、Flux 插画生成、图文排版、词汇注释,全自动完成。
这是一个系列视频的上集,重点讲基础工作流的搭建。下集会讲如何对这个工作流进行改造升级——换画风、换赛道、换平台,一个工作流衍生出无限可能。
本教程配套视频已发布在 YouTube,建议搭配视频一起学习效果更佳。
整个工作流的链路如下:
以前我们用 Schedule 轮询 Notion 的状态字段,效率低还浪费运行次数。这次换一个方案——用 Notion 的 Link 函数拼接外部 Webhook URL。
操作步骤:
link("开始", "webhook_url?id=" + id()) 拼接这样做的好处是真正的实时触发——在手机上打开 Notion APP,填好主题,点一下"开始",工作流就跑起来了。不需要回到 Make 界面操作任何东西。
用 Notion 的 Get a Database Item 模块,传入 Webhook 接收到的 ID,直接拉取整条记录的所有属性——主题、语言、每段字数等。
测试时建议关闭 Schedule,打开工作流开关让它等待触发。这样可以实时看到每个模块的运行结果。
这是整个工作流的核心模块。我用 GPT-4o 模型,通过结构化 JSON 输出一次性生成完整的绘本框架。
输出的 JSON 结构包含:
{
"title": "故事标题",
"main_character": "主角外貌详细描述(中文)",
"main_character in English": "主角外貌(英文,用于 Flux 提示词)",
"paragraphs": [
{
"paragraph": "段落正文",
"scene": "场景描述(角色动作、环境、建筑、天气、时间等)"
}
]
}
关键设置:
这里要花点篇幅讲清楚 Make 中最容易混淆的数据结构概念,因为后续的 Iterator 遍历完全依赖它。
Array(数组):有序的、相同类型元素的集合,用中括号 [] 表示。比如播放列表里的歌曲。
Collection(集合):不同类型元素的组合,用花括号 {} 表示。比如厨房里有碗、锅、杯子。
在我们的场景中,ChatGPT 输出的 paragraphs 是一个 Array,里面每个元素是一个 Collection(包含 paragraph 和 scene 两个不同字段)。这就是 JSON 内嵌数组、数组内嵌集合的典型结构。
Iterator(遍历器)的核心规则:要用遍历器拆分数组,集合内的数据条目名称必须相同才能正确映射。我们的 paragraphs 数组中每个元素都有相同的 paragraph 和 scene 字段,所以遍历器可以正常工作。
如果你遇到 JSON 结构看不清的情况,推荐用在线 JSON 可视化工具把数据粘贴进去,层级关系一目了然。
在遍历之前,先创建一个 Google Docs 文档作为图文混排的容器。文件名映射 ChatGPT 生成的 Title。
然后接上 Iterator 模块,数据源选择 ChatGPT 输出的 paragraphs 数组。Iterator 会把 5 个段落逐一发射到后续模块。
为每个段落单独生成 Flux 绘图提示词。这里用另一个 ChatGPT 模块,角色设定为"儿童故事插画 Flux 提示词生成专家"。
关键设计:
我选择 fal.ai 作为生图平台,原因有三:有清晰的 API 接口、Flux 生图速度极快(单张 2-10 秒)、按量计费几美元就能用很久。
为什么要用自定义 LoRA:
| 需求 | 无 LoRA | 有 LoRA |
|---|---|---|
| 风格一致性 | 每张图风格可能差异很大 | 锁定特定画风 |
| 行业适配 | 通用风格 | 儿童插画/建筑/二次元等精准定制 |
| 系列作品 | 难以保持连贯 | 色彩和线条统一 |
LoRA 文件需要一个直链 URL 传给 fal.ai。大部分网盘(Google Drive、Dropbox)都不提供直链。我找到了一个可以上传 1GB 文件并生成直链的服务,具体地址在视频描述区。备选方案是用 AWS S3 / Google Cloud 的对象存储。
fal.ai 参数配置:
国内推荐 LiblibAI——中文界面、LoRA 资源丰富、质量筛选方便。搜索时选择"插画风格" + "LoRA 类型" + "Flux 模型"进行筛选。
选择 LoRA 要看三点:运行次数多(质量经过验证)、泛化性能好(不同主题都能出图)、瑕疵率低(手部、面部等细节稳定)。
商用场景记得获取 LoRA 作者授权。
图文写入 Google Docs 后,再用一个大模型模块从 Google Docs 读取全文,角色设定为"儿童故事绘本排版整理专家",执行以下任务:
绘本保存在 Notion 后,还可以接上我在小报童中分享过的微信公众号自动发布工作流:
最后在手机订阅号助手里审阅一下,点击发表即可推送。
Q:ChatGPT 结构化输出偶尔格式不对怎么办?
A:确保在高级设置中开启了 Response Format: JSON 和 Parse JSON。GPT-4o 的结构化输出成功率在 99% 以上。如果还有偶发失败,添加一个 Error Handler 模块做容错,让工作流跳过错误继续运行。
Q:角色一致性怎么保证?
A:这个基础工作流通过提示词锚定角色外貌(身高、毛发、服装等具体描述),配合 LoRA 锁定画风,可以做到基本一致。更高级的角色一致性方案(比如 ControlNet、IP-Adapter)会在后续进阶工作流中介绍。
Q:fal.ai 生图费用大概多少?
A:单张图几分钱到一毛左右。一本 5 页绘本总共不到一块钱。充几美元可以用很长时间。
这期我们搭建了一个从主题输入到图文绘本输出的全自动工作流:Notion 实时触发 → ChatGPT 结构化创作 → Flux + LoRA 插画生成 → 图文混排 → 排版整理 → Notion 存储,甚至可以一键发布到微信公众号。3 分钟生成一本风格统一的儿童绘本,成本不到一块钱。
更重要的是,这个工作流的价值不止于儿童绘本。换个 LoRA 就是另一种画风,换个提示词就是另一个赛道——治愈家居、建筑设计、产品展示都可以。
下一期我们就来聊这个话题:一个工作流如何变成 1000 个工作流?从参数、提示词、模块到编排的四层改造方法论,敬请期待。
每周精选 AI 编程与自动化实战内容,直达你的邮箱