Make 19. 3 分钟速成:利用 Make 和 Flux 打造图文并茂的儿童绘本

用 Make.com 和 Flux 图像模型三分钟生成图文并茂的儿童绘本。从 Notion 输入主题后工作流自动完成故事创作、分镜设计、Flux 风格化配图生成和图文混排。教程涵盖 Flux 模型的 LoRA 风格控制、一致性角色提示词编写、图文排版 HTML 模板设计和公众号直发格式适配,零基础也能批量生产风格统一的精美绘本内容。

Make 19. 3 分钟速成:利用 Make 和 Flux 打造图文并茂的儿童绘本

引言

我一直在想,能不能用自动化把内容创作的边界推到图文并茂这个层面——不只是生成文字,连配图都一起搞定。儿童绘本是一个很好的切入点:故事结构简单、风格统一、图文配合紧密,非常适合用工作流来自动化。

我是翔宇。翔宇测试了多种 AI 图文创作方案后发现,Flux 配合 LoRA 在风格一致性上远超其他工具。

这期我搭建了一个完整的儿童插画绘本生成工作流。从 Notion 输入一个主题(比如"小老虎和小蛇的探险故事"),3 分钟后就能拿到一本风格统一、图文混排的绘本,直接可以发公众号。整个过程涵盖故事创作、角色设计、Flux 插画生成、图文排版、词汇注释,全自动完成。

这是一个系列视频的上集,重点讲基础工作流的搭建。下集会讲如何对这个工作流进行改造升级——换画风、换赛道、换平台,一个工作流衍生出无限可能。

你将学到

  • 如何通过 Notion 外部 Webhook 实现工作流实时触发
  • ChatGPT 结构化 JSON 输出生成绘本故事和角色设定
  • Make 中 Array、Collection、Iterator 的核心概念与实战区别
  • 利用 fal.ai 调用 Flux 自定义 LoRA 生成风格统一的插画
  • LoRA 模型的选择标准与直链上传方案
  • Google Docs 实现图文混排编排
  • 大模型完成 Markdown 排版整理与词汇注释
  • 从绘本生成到微信公众号自动发布的全链路

视频教程

本教程配套视频已发布在 YouTube,建议搭配视频一起学习效果更佳。

详细教程

工作流全景

整个工作流的链路如下:

  1. Notion Webhook 触发:点击"开始"链接,实时触发 Make 工作流
  2. 获取主题信息:从 Notion 数据库拉取主题、语言、字数等参数
  3. ChatGPT 故事创作:结构化 JSON 输出,包含标题、角色外貌、5 个段落及场景描述
  4. Iterator 遍历:把 5 个段落拆开,逐一处理
  5. Flux 提示词生成:大模型为每个段落生成英文正向/负向提示词
  6. fal.ai 生图:调用 Flux + 自定义 LoRA 生成儿童插画
  7. 图文混排:将图片和文字写入 Google Docs
  8. 排版整理:大模型从 Google Docs 读取全文,整理 Markdown 格式并添加词汇注释
  9. 保存到 Notion:最终绘本内容存回 Notion 知识库

模块一:Notion 外部 Webhook 触发

以前我们用 Schedule 轮询 Notion 的状态字段,效率低还浪费运行次数。这次换一个方案——用 Notion 的 Link 函数拼接外部 Webhook URL。

操作步骤:

  1. 在 Make 中创建 Custom Webhook 模块,获取 URL
  2. 在 Notion 数据库新建一个公式字段,用 link("开始", "webhook_url?id=" + id()) 拼接
  3. 点击该链接,浏览器跳转显示 "Accepted",Make 工作流立即触发

这样做的好处是真正的实时触发——在手机上打开 Notion APP,填好主题,点一下"开始",工作流就跑起来了。不需要回到 Make 界面操作任何东西。

模块二:获取 Notion 页面信息

用 Notion 的 Get a Database Item 模块,传入 Webhook 接收到的 ID,直接拉取整条记录的所有属性——主题、语言、每段字数等。

测试时建议关闭 Schedule,打开工作流开关让它等待触发。这样可以实时看到每个模块的运行结果。

模块三:ChatGPT 结构化输出生成故事

这是整个工作流的核心模块。我用 GPT-4o 模型,通过结构化 JSON 输出一次性生成完整的绘本框架。

输出的 JSON 结构包含:

{
  "title": "故事标题",
  "main_character": "主角外貌详细描述(中文)",
  "main_character in English": "主角外貌(英文,用于 Flux 提示词)",
  "paragraphs": [
    {
      "paragraph": "段落正文",
      "scene": "场景描述(角色动作、环境、建筑、天气、时间等)"
    }
  ]
}

关键设置:

  • Response Format 必须选 JSON
  • Parse JSON 必须打开(Make 新功能,省掉单独的 JSON 解析模块)
  • 提示词中明确要求每个场景有明显区别——不同的地形、天气、时间,避免五张图看起来一模一样
  • 主角外貌描述要具体到身高、体重、毛发颜色、服装特征,为 Flux 生图提供锚点

核心概念:Array 与 Collection

这里要花点篇幅讲清楚 Make 中最容易混淆的数据结构概念,因为后续的 Iterator 遍历完全依赖它。

Array(数组):有序的、相同类型元素的集合,用中括号 [] 表示。比如播放列表里的歌曲。

Collection(集合):不同类型元素的组合,用花括号 {} 表示。比如厨房里有碗、锅、杯子。

在我们的场景中,ChatGPT 输出的 paragraphs 是一个 Array,里面每个元素是一个 Collection(包含 paragraphscene 两个不同字段)。这就是 JSON 内嵌数组、数组内嵌集合的典型结构。

Iterator(遍历器)的核心规则:要用遍历器拆分数组,集合内的数据条目名称必须相同才能正确映射。我们的 paragraphs 数组中每个元素都有相同的 paragraphscene 字段,所以遍历器可以正常工作。

如果你遇到 JSON 结构看不清的情况,推荐用在线 JSON 可视化工具把数据粘贴进去,层级关系一目了然。

模块四:Google Docs 编排容器

在遍历之前,先创建一个 Google Docs 文档作为图文混排的容器。文件名映射 ChatGPT 生成的 Title。

然后接上 Iterator 模块,数据源选择 ChatGPT 输出的 paragraphs 数组。Iterator 会把 5 个段落逐一发射到后续模块。

模块五:Flux 提示词生成

为每个段落单独生成 Flux 绘图提示词。这里用另一个 ChatGPT 模块,角色设定为"儿童故事插画 Flux 提示词生成专家"。

关键设计:

  • 主角外貌从全局变量引入(不走遍历器),保证每张图的角色描述一致
  • 场景和段落内容从遍历器引入,每张图独有
  • 输出正向提示词和负向提示词,各 400-500 英文单词
  • 包含视角、光线、风格等专业绘图参数

模块六:fal.ai + Flux 自定义 LoRA 生图

我选择 fal.ai 作为生图平台,原因有三:有清晰的 API 接口、Flux 生图速度极快(单张 2-10 秒)、按量计费几美元就能用很久。

为什么要用自定义 LoRA

需求 无 LoRA 有 LoRA
风格一致性 每张图风格可能差异很大 锁定特定画风
行业适配 通用风格 儿童插画/建筑/二次元等精准定制
系列作品 难以保持连贯 色彩和线条统一

LoRA 文件需要一个直链 URL 传给 fal.ai。大部分网盘(Google Drive、Dropbox)都不提供直链。我找到了一个可以上传 1GB 文件并生成直链的服务,具体地址在视频描述区。备选方案是用 AWS S3 / Google Cloud 的对象存储。

fal.ai 参数配置:

  • LoRA 权重:0.8 - 1.0
  • 尺寸:1024×1024 或 3:4
  • 迭代步数:27-28
  • 安全检测:儿童内容必须开启

LoRA 资源推荐

国内推荐 LiblibAI——中文界面、LoRA 资源丰富、质量筛选方便。搜索时选择"插画风格" + "LoRA 类型" + "Flux 模型"进行筛选。

选择 LoRA 要看三点:运行次数多(质量经过验证)、泛化性能好(不同主题都能出图)、瑕疵率低(手部、面部等细节稳定)。

商用场景记得获取 LoRA 作者授权。

模块七:排版整理与词汇注释

图文写入 Google Docs 后,再用一个大模型模块从 Google Docs 读取全文,角色设定为"儿童故事绘本排版整理专家",执行以下任务:

  • 保留所有原文内容和图片链接不做修改
  • 优化 Markdown 排版:标题层级、段落间距、重点词汇加粗
  • 在文末添加词汇注释尾注,提供难词的解释和英文翻译
  • 最终输出保存回 Notion 知识库

从生成到发布:微信公众号全自动

绘本保存在 Notion 后,还可以接上我在小报童中分享过的微信公众号自动发布工作流:

  1. 从 Notion 读取 Markdown 内容
  2. 选择字体(17 种可选)
  3. 将 Markdown 转为微信支持的 HTML 格式
  4. 图片上传到微信服务器
  5. 创建草稿

最后在手机订阅号助手里审阅一下,点击发表即可推送。

延伸阅读

常见问题

Q:ChatGPT 结构化输出偶尔格式不对怎么办?
A:确保在高级设置中开启了 Response Format: JSON 和 Parse JSON。GPT-4o 的结构化输出成功率在 99% 以上。如果还有偶发失败,添加一个 Error Handler 模块做容错,让工作流跳过错误继续运行。

Q:角色一致性怎么保证?
A:这个基础工作流通过提示词锚定角色外貌(身高、毛发、服装等具体描述),配合 LoRA 锁定画风,可以做到基本一致。更高级的角色一致性方案(比如 ControlNet、IP-Adapter)会在后续进阶工作流中介绍。

Q:fal.ai 生图费用大概多少?
A:单张图几分钱到一毛左右。一本 5 页绘本总共不到一块钱。充几美元可以用很长时间。

总结

这期我们搭建了一个从主题输入到图文绘本输出的全自动工作流:Notion 实时触发 → ChatGPT 结构化创作 → Flux + LoRA 插画生成 → 图文混排 → 排版整理 → Notion 存储,甚至可以一键发布到微信公众号。3 分钟生成一本风格统一的儿童绘本,成本不到一块钱。

更重要的是,这个工作流的价值不止于儿童绘本。换个 LoRA 就是另一种画风,换个提示词就是另一个赛道——治愈家居、建筑设计、产品展示都可以。

下一期我们就来聊这个话题:一个工作流如何变成 1000 个工作流?从参数、提示词、模块到编排的四层改造方法论,敬请期待。

资源下载

订阅成功!请到邮箱查收确认链接。

订阅成功!请到邮箱查收确认链接。

订阅成功!请到邮箱查收确认链接。

订阅成功!请到邮箱查收确认链接。

操作成功。

操作已取消。