Paid Media

1 小时搭完 20 个 PMax 素材：我的 Claude + Midjourney 流水线

2025年2月16日

上礼拜二，我用一个不到小时的时间，搭完了一整个 Performance Max（PMax，Google 的智能投放系列）的素材包——20 张图、5 条标题、5 条长标题、5 条描述，外加几个 logo。客户是一个 DTC（Direct-to-Consumer，直接面向消费者）家居品牌，每个月在 Google 上大概投 4 万美金。前一周我给他们报的还是"传统创意生产，三天交付"。后来我坐下来打开 Claude 和 Midjourney，一个 session 就全做完了。

下面就是这条流水线。它没有魔法，只是把创意生产里那段"盯着空白 Figma 文件发呆"的时间砍掉了。

PMax 是个特殊的怪物

讲流水线之前，先说点背景。Google 的 PMax 把一组素材（一个 campaign 一个素材组，或一个产品 feed 一个素材组）丢给 Google，让它的机器学习去决定怎么在 Search、Display、YouTube、Discover、Gmail、Maps 之间排列组合。你给创意，Google 的算法决定在哪、给谁看。

关键点在于：PMax 奖励素材的多样性。Google 明确告诉广告主，素材配额填满的素材组表现更好——这点直接反映在每个素材组右上角的"素材强度"（asset strength）评分上。完整配额是这样的：

图片：最多 20 张，覆盖三种比例——1.91:1（横版，1200×628）、1:1（方形，1200×1200）、4:5（竖版，960×1200）
Logo：最多 5 个，比例 1:1（1200×1200）和 4:1（1200×300）
标题（Headlines）：最多 5 条，每条 ≤ 30 字符
长标题（Long Headlines）：最多 5 条，每条 ≤ 90 字符
描述（Descriptions）：最多 5 条，每条 ≤ 90 字符
视频：最多 5 条，也可以不上传，让 Google 用你的图片自动生成

手填全这些是真的痛。20+ 个不同的图片概念，加 15 条文案，全部有严格的字符限制。我合作过的大部分代理公司都让一个初级设计师花两天去做这件事。AI 吃掉的正是这一段。

6 步流水线

下面是我实际操作过的顺序。时间只是参考——我对这些工具比较熟，第一次上手也应该能控制在 90 分钟以内。

第 1 步——写创意 brief（Claude，5 分钟）

碰 Midjourney 之前，我先在 Claude 里写一份创意 brief。这是整个流水线里最关键的一步——后面所有东西都继承你在这里写的内容。

一个典型的 prompt：

我要为一个 DTC 品牌搭一个 Performance Max 素材组，它卖的是 [产品品类]，目标人群是 [人群描述]。品牌调性是 [语气——比如：温暖、内敛、现代]。价格带是 [区间]。核心差异化：[3–5 个要点]。我们想和下面这些竞品拉开距离：[列表]。

请输出一份创意 brief，包含：(1) 8 个可以用作图片素材的视觉概念；(2) 5 条 ≤ 30 字符的标题；(3) 5 条 ≤ 90 字符的长标题；(4) 5 条 ≤ 90 字符的描述；(5) 3 个 logo 概念（1:1 和 4:1 各一）。素材之间的情绪基调要拉开差距——不要让 20 张图看起来都是同一张照片。

最后这句很关键。Google 的算法会打乱重组你的素材，如果 20 张图都带着同一种情绪，最后就是同一条广告的 20 个变体。系统需要对比：有暖色也有冷色，有纯产品也有生活方式场景，有叠文字的也有干净背景的。

第 2 步——生成图片 prompt（Claude，10 分钟）

把第 1 步得到的 8 个视觉概念交给 Claude，让它把每个扩成一条可以直接喂给 Midjourney 的 prompt。不要自己写——prompt 语法（相机、镜头、光线、风格锚点）很琐碎，Claude 训过的 Midjourney 社区语料足够多，能直接输出能用的 prompt。

基于上面这 8 个概念，请为每个写一条 Midjourney v6 的 prompt。包含：主体、构图、光线、镜头、风格参考。要有变化——其中至少 2 张是白底棚拍产品图，2 张是生活方式/环境场景，1 张是俯拍 flat-lay（平铺），1 张是人和产品互动的场景，1 张是微距/特写细节，1 张更抽象或聚焦材质纹理。

每条都加上 --ar 4:5 --style raw --v 6。方形和横版的变体请把 --ar 改一下再作为独立的 prompt 输出，这样我可以一次性跑三种比例。

为什么要按比例拆开：Midjourney 的 --ar 是按次生成设定的。一个概念想要三种比例，就要跑三次。批量跑的方法我下面讲。

第 3 步——在 Midjourney 渲染图片（25 分钟）

打开 Midjourney，贴上 prompt，开始跑。下面这个批量技巧是最省时的：

用 Fast mode，/settings → 关掉 Variation Mode: High，Stylize 调到 Medium。默认的 Stylize: High 出图很美，但会慢 2–3 倍，而且对产品类素材容易过度风格化。
先用 1:1 把 8 个概念全跑一遍。 利用 Discord 的消息队列——一次性贴 8 条 prompt，连按 8 次回车，离开 3 分钟。Midjourney 会按顺序排进队列。
每张结果出来，挑最好的格子用 U1–U4（upscale，放大单图），如果想看更多变体用 V（variations）。
同样的批跑一遍 --ar 4:5 和 --ar 16:9（注意：PMax 其实不用 16:9，但我发现 4:5 竖版在 Discovery 和 YouTube 的版位上比 1.91:1 表现好，而 Midjourney 的 16:9 网格可以当作"看一下更宽的画幅"的快速校验）。

合计：大概 8 个概念 × 3 个比例 = 24 次生成，再加上少量重跑（碰到不对路的图）。不刷自己渲染结果的话，25 分钟是现实的。你一定会刷。

第 4 步——放大并导出（5 分钟）

挑完赢家之后，放大到最大分辨率然后下载。Midjourney 默认输出是 1024×1024，不够 PMax 要求的 1200×1200，所以用 Upscale (Subtle) 或 Upscale (Creative)——生活方式类用 Creative 没问题，产品图用 Subtle 更稳。

全部丢到一个 Google Drive 文件夹里，用素材组的名字命名。这一步先别想着怎么整理——等确定哪几张进最终素材的时候再改名。

第 5 步——生成文案变体（Claude，5 分钟）

到这里，你手里已经有第 1 步 brief 给的 5 条标题、5 条长标题、5 条描述。别直接用。它们是起点，不是终点。原因：第 1 步的输出有点"AI 营销腔"——听起来对，但没有那种让用户点击的具体摩擦力。

把它们再丢回 Claude 要变体：

这里有 5 条标题、5 条长标题、5 条描述。请为每条再生成 3 个变体，每个变体要聚焦一个具体的客户痛点或使用场景。用具体的语言——把问题点出来，把场景点出来，把感受点出来。避免"提升你的日常""焕新你的空间"这种通用表达。目标是说出来像是一个真实的人在跟朋友讲话。

这第二遍 prompt 让你手里文案选项翻倍。每种挑最好的 5 条，15 个文案槽位就齐了，而且每一句都带质感。

第 6 步——上传、评分、迭代（10 分钟）

打开 Google Ads 的素材组面板，把东西全传上去。Google 的"素材强度"会从"差"走到"一般"再到"好"，随着你把槽位填满。别停在"好"——推到"极佳"，方法是再加一张图、换掉一条弱标题、把任何显得泛泛的描述替换掉。

如果文件命名规范、素材组本身已经存在，整个上传和清理大概 10 分钟。新建素材组的话更接近 20 分钟。

容易踩的坑（以及怎么修）

团队第一次跑这条流水线通常会出三种问题。都能修。

品牌一致性在第 1 张图看着挺好，到第 12 张就崩了。 Midjourney 的风格在一个 session 内是一致的，但跨 prompt 会漂移。修法：先选一张"主图"（hero image）把你要的感觉定死，然后用它的 seed，或者把它的 URL 喂给 /describe 提取一个风格锚点，再粘到其他 prompt 里。Midjourney v6 有个更直接的方式——--sref [URL]，传你最好那张图的 URL，后面的生成就会继承那个美学调性。

带文字的图片总是出 bug。 Midjourney 写文字是出了名的烂。如果你的图片概念里要在图上叠一行标题，别浪费时间反复重跑去拿一张"文字不出错"的图——去 Canva 或 Figma 里后期加文字就行。PMax 允许文字叠层，而且带文字叠层的素材通常是素材组里点击率（CTR）最高的那批。

"极佳"素材强度 ≠ 极佳表现。 Google 的这个评分衡量的是多样性和配额覆盖度，不是创意质量。我见过"极佳"素材组跑不过"一般"素材组，原因是每张图都是炫酷的 Midjourney 渲染，根本看不到产品本身。修法：20 张里至少 4 张要是真实产品图或者能清楚看到产品的图。AI 生成的生活方式图用来拓量没问题，但底层的转化版位上，必须有真实产品图来兜。

这一次省下来的一小时

如果用传统方式搭这个素材组，流程是这样的：写 brief 文档、跟设计师开 kickoff 会、2–3 轮修改、客户审批、最终导出、上传。实际算下来，2–3 个工作日，分散在一周里。

用 Claude + Midjourney 的流水线，这一小时里我大部分时间花在创意决策上——推哪些概念、留哪些渲染图、磨哪段文案。"把东西做出来"那部分大概占 20% 的时间。"决定做什么"的部分还是占 80%——这本来就是应该的比例。

老实说有一个适用前提：这套适合有视觉化产品、品牌调性清晰的 DTC/B2C 品牌。 B2B 卖抽象服务的，AI 图像生成就不合适——你用 Claude 跑文案那一半，Midjourney 那部分直接跳过，改用图库或真实拍摄。

另一个前提：AI 生成的素材组在花真钱投放之前，还是要过一遍人工审核。让品牌方过一遍，法务过一遍（文案里有任何承诺的话），最好让几个真实客户也看一眼。流水线负责出量，你身边这些人负责判断。

一小时是真的。下一个素材组试试，然后回来告诉我哪里崩了。

Twitter LinkedIn Facebook Reddit Email

PMax 素材刷新：30 张图片变体 + 15 条 RSA 标题（Recraft + Claude）小预算 AI 出价优化：每天 50 美元也别烧钱一份 Brief 出 50 条 Meta 广告文案：Claude 全流程实战用 20 个素材生成 1,000 条有效 RSA 组合（Gemini + CSV 导出）