学员实践:openbili AI 接入驾驶舱介绍
Calvin 是「翔宇工作流」的学员,方向是 AI 模型中转。他把这件事做成了独立站点「openbili」,覆盖 OpenAI SDK 兼容、模型路由、调用成本可见、失败可解释。本文将其介绍给关注同方向的读者。
用 Make.com 和 RAG 检索增强生成技术搭建跨境电商文章自动化创作工作流。工作流从产品数据库提取信息,结合 RAG 检索行业知识库生成专业度高的产品评测和选购指南,自动适配不同电商平台的内容规范。教程涵盖向量数据库接入、RAG 检索策略配置、电商 SEO 文章模板和多平台分发逻辑,帮助跨境卖家实现内容营销自动化。
做跨境电商的朋友一定有过这样的体验:每上一个新品,就要写亚马逊 Listing 五点描述、产品详情页、推广种草文、Q&A 问答......一个 SKU 至少四五篇内容,几十个 SKU 下来工作量直接爆炸。更痛苦的是,这些内容必须基于真实的产品参数,不能瞎编,否则差评和退货率会让你怀疑人生。
我是翔宇。翔宇帮几位跨境卖家搭建过类似的内容系统,RAG 引入行业知识后文章的专业度明显提升了一个台阶。
我一直在思考一个问题:有没有办法把商品信息"喂"给系统,让它自动按需求生成不同类型的内容?传统的做法是把知识库存在 Notion 里,用关键词检索。但关键词匹配太死板——你搜"无线键盘",知识库里写的是"蓝牙机械键盘",直接就搜不到了。
所以这期我决定用 Make 搭建一套完整的 RAG(检索增强生成)系统,把商品信息转成向量存到 Pinecone,用语义检索替代关键词匹配,再把检索到的上下文交给大模型生成内容。整个流程零代码、全自动、实时触发,从表格改个状态到内容生成完毕,一气呵成。
本教程配套视频已发布在 YouTube,建议搭配视频一起学习效果更佳。
在聊具体搭建之前,我先解释一下为什么要用 RAG,而不是直接把知识库丢给大模型。
打个比方:手机和电脑没法直接交易,但换成货币就能自由兑换了。RAG 做的事情类似——把文本和问题都转成"向量"这种统一的度量衡,通过向量之间的相似度计算来找到最相关的知识片段。
传统的关键词检索有个致命问题:灵活性不够。你在 Notion 里用"关键词"字段做检索,如果用户输入的是"RAG",但知识库里写的是"检索增强生成",就匹配不上。而且传统方式每次都是把整条知识拉过来,上下文过长,成本高、效果差。
RAG 的优势很明确:
| 维度 | 传统关键词检索 | RAG 向量检索 |
|---|---|---|
| 匹配方式 | 精确关键词 | 语义相似度 |
| 模糊查询 | 不支持 | 天然支持 |
| 上下文长度 | 整条知识 | 精准片段 |
| 调用灵活性 | 绑定 Notion | 任意工具可调用 |
| 动态更新 | 手动同步 | 自动校验更新 |
整个工作流分为两大部分:
Part 1:文本嵌入——从 SmartSuite 获取商品信息 → 汇总字段 → Jina Embeddings v3 生成向量 → 写入 Pinecone 向量数据库
Part 2:内容生成——接收创作需求 → 大模型生成检索语义 → Jina 嵌入查询向量 → Pinecone 相似度检索 → Jina Reranker 重排 → OpenRouter 大模型生成最终内容
两部分通过 SmartSuite 的状态字段统一触发,改"开始嵌入"走嵌入流程,改"开始创作 Listing"走 Listing 生成,改"问答"走问答流程,改"开始创作推广文章"走推广文章生成。
我选择 SmartSuite 作为触发器,原因很简单:它支持 Webhook 实时触发,改个状态工作流就自动跑起来,不需要回到 Make 手动点 Run Once。
配置步骤:
如果你更习惯用 Airtable,效果一样,只是 Airtable 需要通过内置自动化或 Button 来触发外部 Webhook。我在小报童里也放了 Airtable 版本的完整工作流。
SmartSuite 表格的字段设计直接决定了后续嵌入的质量。我用的字段包括:
这里有个小技巧:在汇总字段时,我把商品 Title 也拼接到每个片段前面。这样即使后续只检索到某个局部参数(比如"USB-C 接口"),大模型也能知道它属于哪个商品,回答更精准。
嵌入模块使用 Jina Embeddings v3,通过 HTTP 模块调用。关键参数:
jina-embeddings-v3retrieval.passage,查询嵌入选 retrieval.query(Jina v3 会根据任务类型生成不同的向量,这是它的核心优势)Token 长度上限约 8000,按中文换算大概能容纳 5000 字左右。如果不确定字段长度,可以用 Make 的文本分析器检查。
Pinecone 是 Make 原生内置的模块,配置非常丝滑:
写入时要设置 Metadata,包括:
这是整个工作流的精华之一。逻辑如下:
记得打开 Fallback 路径,确保查询失败时也能走插入流程。
内容生成的流程链路:
retrieval.query。jina-reranker-v2-base-multilingual 多语言模型,把 Pinecone 返回的结果按相关性重排,最相关的排前面。亚马逊 Listing:角色设定为亚马逊电商优化大师,输出标准的五要素——Title、Bullet Points、Search Terms、Image Description、Description。所有内容必须严格基于商品信息,禁止虚构。
推广种草文:角色设定为产品评测助理,以第一人称撰写"什么值得买"风格的体验文。关键技巧是加入"可能的缺点"环节——全是夸反而不真实,有理有据地提一两个小缺点,转化率更高。
问答:角色设定为 RAG 专家,200 字以内中文回答,知道就答不知道就说不知道,所有引用都要标注来源。
最后一步是在 Make 中设置路由器,根据 SmartSuite 的状态字段分发到不同的生成路径:
每个分支末尾加上 HTTP Status Code = 200 的校验条件,确保上游请求成功后才执行后续操作。
很多朋友问我为什么不用 Coze 或 Dify 来搭这套系统。核心区别在于定位:
两者不冲突。我的思路是把 Coze 和 Dify 当成 Make 的第 2001 和第 2002 个应用模块——用 Make 编排整体流程,在需要 Agent 能力的环节调用它们。
Q:SmartSuite 和 Airtable 选哪个?
A:追求免费用 SmartSuite,追求体验和生态用 Airtable(约 $20/月)。功能上两者都能实现 Webhook 实时触发,我在小报童里两个版本都提供了。
Q:Pinecone 免费版够用吗?
A:对于几百到几千条商品数据完全够用。如果你的 SKU 量级在万级以上,可能需要付费版本。
Q:RAG 系统只能用在跨境电商吗?
A:完全不是。法律知识库、财经数据库、产品文档库、客服知识库——任何需要"基于私有知识生成内容"的场景都适用。垂直领域的专业知识库,精准度远超通用大模型直接生成。
Q:不同类型的文档怎么切片?
A:表格数据按行切(一行一个商品);PDF 可以按标题层级或按页切;长文建议先生成摘要,再把摘要信息附加到每个片段里,提升检索效果。
这期我们从零搭建了一套完整的 RAG 自动化系统,涵盖了文本嵌入、向量存储、相似度检索、重排、内容生成的全链路。整个系统零代码、云端运行、实时触发、自动校验更新,真正实现了"改个状态就出内容"的效率。
这套方法论的价值不止于跨境电商。任何人都可以搭建自己的垂直领域 RAG 知识库——把书籍、PDF、视频字幕、行业资料处理好存进去,就是一个比通用大模型更专业的知识引擎。
下一期我们来聊一个完全不同的方向:用 Make 和 Flux 全自动生成儿童插画绘本,3 分钟一本,敬请期待。
每周精选 AI 编程与自动化实战内容,直达你的邮箱