用 Midjourney 给品牌 Instagram 轮播建 Style Sheet:那条 4.7 万曝光的帖子是怎么做出来的
目录
上个月我发了一条 Instagram 轮播(Instagram carousel,即支持左右滑动的多图帖子),十张图全是 Midjourney 出品。跑出来 4.7 万曝光、320 次收藏,评论区还有四个人私信问"你是不是有设计团队"。没有。我有的是一段 200 字的 Midjourney style reference,加上一套 25 分钟就能跑完 10 张图的工作流。
大多数人在用 Midjourney 做品牌轮播时,方法都是错的。他们一张张"按品牌调性"出图,然后奇怪为什么整组幻灯片看起来像不同账号发的——灯光跑偏、色温漂移、整体调性各异——整条轮播读起来像一个 mood board(情绪板,把一堆参考图拼在一起找感觉的设计草图),不是一个品牌。
解药不是多生图,是先建一张 style sheet(风格指南,这里指把视觉规范写死成可复用的 prompt 模板)。
Midjourney Style Sheet 到底是什么?
在 Midjourney v6 和 v7 里,你可以传一个 --sref(style reference,风格参考图)URL,指向任何一张你想模仿美学的图。模型会按这个美学出图——同样的色温、同样的渲染风格、同样的构图密度、同样的"感觉"。对 Instagram 轮播来说,光是这一个 flag(参数开关),就决定了你是拿到一组连贯的 10 张幻灯片,还是一堆视觉垃圾。
对品牌轮播来说,"style sheet"是三件东西绑在一起工作:
- 一组参考图(3 张起),用它定义品牌的视觉语言
- 一段固定的 prompt 前缀,锁死那些"永远不该变"的变量——画幅比例、光线风格、配色、渲染风格
- 一段可变的 prompt 后缀,每张图换一次——主体、文字叠加位置、画面焦点
大多数人完全跳过第 2 步和第 3 步。他们每张图都写个独立 prompt,然后在末尾挂一个 --sref。这给你风格统一,但丢了结构统一。最后出来十张"好看"的图,凑不成一组。
第一步:建参考图集
这一步不能偷懒。挑 3-5 张能代表你要的品牌视觉语言的图,可以是:
- 你现有品牌素材库里的、你觉得"对味"的一张照片
- 竞品发的一条有同样气质的帖子(不是用来抄,是用来校准)
- 一张正好打中你要的灯光/配色的 stock photo(素材图)
- 一张 AI 生成的、看起来"就应该是我家品牌该有的样子"的图
- 一张"异类"——和其他几张略有不同,留作后面给幻灯片做变化
没人告诉你的坑: --sref 的权重是一个数字,但它管的不只是美学。权重太高(600-1000)会盖掉你 prompt 里的结构性细节——你说"广角",出来的可能是"近景",因为参考图本身就是近景。我做品牌轮播时,参考权重压在 200-300,这样有风格影响、不会结构劫持。
把参考图统一存到 /brand/midjourney-refs/ 目录里,用语义化标签命名(warm-light-3.jpg、editorial-portrait-1.jpg),省得以后忘了哪张是干嘛的。
第二步:固定 prompt 前缀
这是一段在 10 张图里都保持不变的 prompt 段落。我的版本大致是:
Editorial photography, soft directional key light from the upper left,
muted earth-tone palette (warm sand, deep terracotta, sage, cream),
shallow depth of field, f/2.8, 35mm lens, shot on Portra 400 film stock,
4:5 aspect ratio --ar 4:5 --style raw --sref [URL] --sw 250 --v 7关键 flag 拆解:
--ar 4:5— Instagram 轮播标准比例。再宽在手机上看就不对劲。--style raw— 关掉 Midjourney 默认的"美颜模式",那个模式容易过饱和。--sw 250— 风格参考权重。够低,给 prompt 留发挥空间。--v 7— 用 v7。v6 的色彩科学做编辑摄影会偏"AI 感"。
没人告诉你的坑: 用纯英文描述色板("muted earth-tone palette"),每次生成出来都未必一样——Midjourney 对形容词的解释每次都在变。解法:要么用 hex 色码(用 --color,如果你的版本支持),要么用一张已知配色图的 --cref(character reference,角色参考),再描述情绪。我固定用一张配色色板图,把它当 --cref 引进去,这样调色就锁死了。
第三步:可变 prompt 后缀(每张图换一次)
可变部分就是每张幻灯片的主体。10 张轮播图,前缀不变,后缀在变。比如"5 个生产力工具"轮播的第 3 张,后缀是这样:
[固定前缀]
+ "一张翻开的旧皮面笔记本,放在木桌上,晨光,一支铜笔搁在
书页上,无文字,无 logo,右侧留出负空间""留出负空间"(negative space,即画面中刻意空出来给文字叠加的区域)这条很重要。轮播图永远要叠文字——标题、正文、CTA(Call To Action,行动号召按钮)。如果你的 Midjourney 图构图太满,文字就没地方塞。我每条 prompt 都会加"上方三分之一留负空间"或"右侧打开",原因跟设计师在杂志版面上留白是一回事。
没人告诉你的坑: Midjourney 其实不会乖乖听"X 边留负空间"这种话。70% 的情况下构图是对的,剩下 30% 你得重抽,或者扔进 Photoshop 修补(inpaint,AI 局部重绘)。我每张图都会多预算 4-5 次生成专门对付这种情况。
第四步:字体系统
品牌不只是图,还有叠在上面的字。轮播需要一套统一的字体系统,"统一"恰恰是大多数 AI 生成的轮播垮掉的地方——图挺好,结果因为 Canva 太好用,每张幻灯片换了一个字体。
选两套字体,死守到底:
- 标题字 — serif(衬线体,即字母末端带小尾巴的传统字体)或几何无衬线,字重 600-700。用于钩子页和分节页。
- 正文字 — 干净的 grotesque(怪诞体,一类笔画方正的无衬线字体) sans(Inter、Söhne、General Sans)。其他全部用它。
颜色从图的主色板里取。用吸管(eyedropper)点一下主视觉的图、拿到 hex 色值、用作标题色。编辑设计师就是这么干的。
没人告诉你的坑: 如果所有幻灯片都用同一个标题色,深色背景那张就读不清了。解法:两套标题色。品牌主色 + 主色的 70% 暗色版,专门给深色背景用。我在 Figma 里用 "color swap"(色值替换)图层,3 秒换一张。
第五步:网格规则
Instagram 轮播在 4:5 的画框里,有一块"安全区"。距顶/底边 80px 之外的文字,在部分 Android 屏幕上会被裁掉。距左/右边 60px 之内的视觉元素,在 iOS 上会被 UI(界面元素,比如点赞计数、"..." 按钮)挡住一部分。
我的规则:
- 标题 — 顶部 25% 或底部 25%,绝对不放在正中间
- 副标题 — 紧挨标题,不要漂浮在空地
- CTA — 只放底部 20%,绝不放顶部(用户从下往上滑)
- Logo / 账号 — 右下角,要小
每张图网格是一样的。画面构图在变,文字位置不变。这就是一组幻灯片"读起来是一组"的根本原因。
第六步:10 张轮播模板
对教育型/价值型轮播(那种会被收藏和转发的),我默认的 10 张结构:
- 钩子页 — 全屏图 + 一句加粗的核心观点
- 铺垫 — 图 + 2 句话框定问题
- 要点 1/N — 第一个技巧,配相关图
- 要点 2/N — 第二个技巧
- 要点 3/N — 第三个技巧
- 要点 4/N — 第四个技巧
- 要点 5/N — 第五个技巧
- 回顾 — 图 + 5 行字,一行一个要点
- 行动号召 — 图 + "收藏 / 转发 / 关注看更多"
- 尾页 — 品牌图 + 账号 + "下一条轮播预告"
N 通常 5-7 张,这是数据上跑得最好的范围。超过 8 个"要点"页,收藏率会掉。
第七步:质量门(别跳)
发出去之前,每张图过一遍:
- 颜色检查 — 这张跟其他几张搭不搭?Midjourney 的色偏有时候会在第 4 张到第 7 张之间冒头。Photoshop 里拉一下 hue/saturation(色相/饱和度),10 秒搞定。
- 构图检查 — 该放文字的地方有没有足够的负空间?没有就重生。
- 字号检查 — 标题在缩略图尺寸下还读得清吗?信息流的九宫格里,算法只给你看缩略图。标题在 200px 宽读不清,这图就废了。
- 气质检查 — 这张图看起来像同一个人做的吗?这是感性检查。感觉不对,就是不对,信它。
没人告诉你的坑: 算法把曝光权重压给第一张图。用户在 0.3 秒内决定要不要滑。后面的 9 张只会被已经决定滑的人看到。所以,你的生成预算应该有 40% 投在第 1 张,不是像大多数人那样只投 10%。
真正重要的三件事
跑了 6 个月、4 个品牌账号之后,真正起作用的只有三件事:
1. 固定前缀不可妥协。 每张图都用同一个前缀,哪怕你觉得"这张用别的会更好看"。一致性赢。唯一一张你破例换前缀的,就是拖垮整组轮播的那张。
2. 定义品牌的是参考图集,不是 prompt。 你可以 prompt 写得烂、但参考图选得强,出来的图也像品牌的。你也可以 prompt 写得强、但参考图平庸,出来的图就是平庸。投资在参考图上。
3. 网格比图更像品牌。 用户记住的是标题在哪儿、CTA 是什么色、Logo 是不是在同一个角落。图会变,网格不变。
我第一次建 style sheet 用了整整一天。现在给一个新品牌做,30 分钟搞定,出来的图看起来像花了一周。短版本:建好参考图集、锁住前缀、每张只换后缀、网格死守。