学员实践:openbili AI 接入驾驶舱介绍
Calvin 是「翔宇工作流」的学员,方向是 AI 模型中转。他把这件事做成了独立站点「openbili」,覆盖 OpenAI SDK 兼容、模型路由、调用成本可见、失败可解释。本文将其介绍给关注同方向的读者。
n8n 加 MCP 协议实操指南,将任意 n8n 工作流接入 MCP 让大模型直接调用。以 AI 风格化图片生成为案例,输入一句话选个风格一分钟出图且支持上百种风格。教程涵盖 MCP 协议原理、n8n 工作流 MCP 化改造步骤、多模型风格库搭建和 Claude Desktop 集成测试,掌握后可将所有自动化能力变成 AI 助手的可调用工具。
如果你做自媒体,一定遇到过这个问题:写完文章或者拍完视频,需要一张风格匹配的封面图,但美工不在线、自己设计又太慢。我之前也一样——直到我用 n8n 搭了一套工作流,输入一句话选个风格,1 分钟出图,而且支持上百种风格。
我是翔宇。这期视频的核心不只是图片生成本身,而是一个更大的命题:如何把 n8n 的任意工作流接入 MCP 协议,让你在任何支持 MCP 的大模型对话中直接调用。换句话说,你在 Cherry Studio 或手机上聊天的时候,一句话就能触发 n8n 后台的图片生成、RAG 检索,甚至任意自定义工作流。这是 n8n 生态的一次跨越。
本教程配套视频已发布在 YouTube,建议搭配视频一起学习效果更佳。
人用 UI 图形界面操作软件,软件用 API 接口互相调用。那大模型用什么?答案是 MCP——Model Context Protocol(模型上下文协议),由 Anthropic 提出。
你只需要记住一句话:MCP 是给大模型用的。它通过结构化的上下文,在对话中嵌入工具调用和参数标注,打通大模型和外部工具、数据库之间的连接。
从互联网时代的网站,到智能手机时代的 APP,到大模型时代的 MCP——工具的形态一直在跟随使用者的变化而进化。
n8n 最近推出了 MCP Server Trigger 节点。这个节点允许你把 n8n 的各种能力——HTTP 请求、子工作流、RAG 知识库、原生节点工具——全部接入大模型调用。
支持的工具类型包括:
有了这个节点,你可以在手机上、电脑上、任何支持 MCP 的对话软件中原生调用 n8n 的全部能力。
这是我想出的一个调用路径,目前没有看到其他人讲过。核心思路是利用 Merge 聚合节点实现"双入口"架构:
这样一个工作流就同时支持两种触发方式——表单页面直接使用,和通过 MCP 在大模型对话中调用。后续你搭建任何工作流,都可以用这个模式改造成 MCP 服务。
表单输入:配置 5 个字段——提示词(TextArea)、模型选择(Dropdown:Flux / GPT-image-1)、图片风格(Dropdown:几十种预设风格)、图片尺寸(Dropdown)、透明度(Dropdown:自动/透明/不透明)。
AI Agent 风格提示词生成:这是工作流的核心节点。系统提示词中嵌入了我整理的 341 种图片风格库——来源是 GitHub 开源项目 awesome-gpt4o-images,收录了推特上各位生图大佬实践出来的高质量风格提示词。用户选择一个风格后,Gemini 2.0 Flash 模型会参考风格库中的描述,结合用户输入的内容,生成一个专业的图片生成提示词。
选择 Gemini 2.0 Flash 的原因:免费额度充足,长上下文能力强(风格库文本很长),风格提取准确度高。
结构化输出:大模型生成的提示词需要提取为 JSON 格式。我用了一个 Information Extractor 节点配合 GPT-4o mini,将输出解析为标准字段(中文名、英文名、中文提示词、英文提示词、宽度、高度)。
模型路由:Switch 节点根据用户选择的模型分流——走 Flux 分支调用 Together AI 的免费 API,走 GPT-image-1 分支调用 302.AI 的 API。生成的图片自动上传到 Cloudinary 图床,获取永久直链。
结果返回:最终通过 Form Ending 节点渲染 HTML 页面,展示生成的图片和相关信息。
n8n 没有 Cloudinary 的原生模块,但可以通过 HTTP Request 节点调用其不签名上传 API。在 Cloudinary 后台创建一个 Upload Preset(不签名模式),拿到 Preset Name 和 Cloud Name,配置到 n8n 的参数节点中即可。Cloudinary 的免费额度非常大,我用了很久都没触及上限。
注册 Together AI 后,在 Playgrounds 中可以找到 Flux free 模型——调用完全免费。获取 API Key 后配置到 n8n 中,通过 HTTP Request 节点发送生图请求即可。
使用这套工作流生成的图片涵盖多种风格场景:
手绘信息图卡片:输入"介绍翔宇工作流",选择手绘信息图风格,生成带有 YouTube 图标和频道名称的精美卡片。
复古宣传海报:选择复古海报风格,自动生成带有年代感的频道宣传图。
小红书封面:输入"翔宇工作流上新啦",选择小红书风格,生成渐变色彩的封面图,中文字体展示清晰。
3D 情侣珠宝盒摆件:GPT-image-1 模型的提示词控制力极强,能生成细致精美的 3D 渲染摆件。
代码风格名片:输入频道名和 slogan,生成类似代码编辑器界面的创意名片。
水晶球故事场景:输入"水晶球里的大明王朝 1566",生成精美的微缩宫殿场景。
宫崎骏风格、8 位像素图标、迷你 3D 建筑、赛博朋克景观、超写实 3D 游戏角色等数十种风格均可通过选择对应风格一键生成。
Q:GPT-image-1 和 Flux 怎么选?
A:GPT-image-1 中文理解和提示词控制力更强,适合需要精确文字展示的场景(小红书封面、品牌海报);Flux 完全免费,画面质量也不错,但中文处理较弱、Logo 识别不准确。建议日常图片用 Flux 省成本,重要场景用 GPT-image-1。
Q:Cherry Studio 怎么配置 MCP?
A:在 Cherry Studio 的设置中添加 MCP 服务器,填入 n8n MCP Server Trigger 生成的 URL 即可。之后在对话框中启用 MCP,大模型会自动识别并调用你的工作流工具。
Q:风格库可以自己扩展吗?
A:可以。我目前整理了 341 种风格,你可以从推特、Reddit 等地方找到新的优秀图片风格提示词,按照我的格式添加到风格库文本中,工作流的 Dropdown 菜单里同步添加选项即可。
这期内容的核心价值有两个:一是搭建了一套支持上百种风格的多模型图片生成工作流,Flux 免费无限生图、GPT-image-1 精准控制,配合 Cloudinary 图床实现秒出可用链接;二是提出了将任意 n8n 工作流嵌入 MCP 的通用方法——通过 Merge 聚合双分支统一输入格式,让你的工作流可以在任何大模型对话中被直接调用。
下一期我会带来 SEO 自动化的 n8n 教程,3 步搞定跨境电商关键词挖掘。
每周精选 AI 编程与自动化实战内容,直达你的邮箱