Paid Media

1 小时搭完 20 个 PMax 素材:我的 Claude + Midjourney 流水线

1 小时搭完 20 个 PMax 素材:我的 Claude + Midjourney 流水线
目录

上礼拜二,我用一个不到小时的时间,搭完了一整个 Performance Max(PMax,Google 的智能投放系列)的素材包——20 张图、5 条标题、5 条长标题、5 条描述,外加几个 logo。客户是一个 DTC(Direct-to-Consumer,直接面向消费者)家居品牌,每个月在 Google 上大概投 4 万美金。前一周我给他们报的还是"传统创意生产,三天交付"。后来我坐下来打开 Claude 和 Midjourney,一个 session 就全做完了。

下面就是这条流水线。它没有魔法,只是把创意生产里那段"盯着空白 Figma 文件发呆"的时间砍掉了。

PMax 是个特殊的怪物

讲流水线之前,先说点背景。Google 的 PMax 把一组素材(一个 campaign 一个素材组,或一个产品 feed 一个素材组)丢给 Google,让它的机器学习去决定怎么在 Search、Display、YouTube、Discover、Gmail、Maps 之间排列组合。你给创意,Google 的算法决定在哪、给谁看。

关键点在于:PMax 奖励素材的多样性。Google 明确告诉广告主,素材配额填满的素材组表现更好——这点直接反映在每个素材组右上角的"素材强度"(asset strength)评分上。完整配额是这样的:

  • 图片:最多 20 张,覆盖三种比例——1.91:1(横版,1200×628)、1:1(方形,1200×1200)、4:5(竖版,960×1200)
  • Logo:最多 5 个,比例 1:1(1200×1200)和 4:1(1200×300)
  • 标题(Headlines):最多 5 条,每条 ≤ 30 字符
  • 长标题(Long Headlines):最多 5 条,每条 ≤ 90 字符
  • 描述(Descriptions):最多 5 条,每条 ≤ 90 字符
  • 视频:最多 5 条,也可以不上传,让 Google 用你的图片自动生成

手填全这些是真的痛。20+ 个不同的图片概念,加 15 条文案,全部有严格的字符限制。我合作过的大部分代理公司都让一个初级设计师花两天去做这件事。AI 吃掉的正是这一段。

6 步流水线

下面是我实际操作过的顺序。时间只是参考——我对这些工具比较熟,第一次上手也应该能控制在 90 分钟以内。

第 1 步——写创意 brief(Claude,5 分钟)

碰 Midjourney 之前,我先在 Claude 里写一份创意 brief。这是整个流水线里最关键的一步——后面所有东西都继承你在这里写的内容。

一个典型的 prompt:

我要为一个 DTC 品牌搭一个 Performance Max 素材组,它卖的是 [产品品类],目标人群是 [人群描述]。品牌调性是 [语气——比如:温暖、内敛、现代]。价格带是 [区间]。核心差异化:[3–5 个要点]。我们想和下面这些竞品拉开距离:[列表]。

请输出一份创意 brief,包含:(1) 8 个可以用作图片素材的视觉概念;(2) 5 条 ≤ 30 字符的标题;(3) 5 条 ≤ 90 字符的长标题;(4) 5 条 ≤ 90 字符的描述;(5) 3 个 logo 概念(1:1 和 4:1 各一)。素材之间的情绪基调要拉开差距——不要让 20 张图看起来都是同一张照片。

最后这句很关键。Google 的算法会打乱重组你的素材,如果 20 张图都带着同一种情绪,最后就是同一条广告的 20 个变体。系统需要对比:有暖色也有冷色,有纯产品也有生活方式场景,有叠文字的也有干净背景的。

第 2 步——生成图片 prompt(Claude,10 分钟)

把第 1 步得到的 8 个视觉概念交给 Claude,让它把每个扩成一条可以直接喂给 Midjourney 的 prompt。不要自己写——prompt 语法(相机、镜头、光线、风格锚点)很琐碎,Claude 训过的 Midjourney 社区语料足够多,能直接输出能用的 prompt。

基于上面这 8 个概念,请为每个写一条 Midjourney v6 的 prompt。包含:主体、构图、光线、镜头、风格参考。要有变化——其中至少 2 张是白底棚拍产品图,2 张是生活方式/环境场景,1 张是俯拍 flat-lay(平铺),1 张是人和产品互动的场景,1 张是微距/特写细节,1 张更抽象或聚焦材质纹理。

每条都加上 --ar 4:5 --style raw --v 6。方形和横版的变体请把 --ar 改一下再作为独立的 prompt 输出,这样我可以一次性跑三种比例。

为什么要按比例拆开:Midjourney 的 --ar 是按次生成设定的。一个概念想要三种比例,就要跑三次。批量跑的方法我下面讲。

第 3 步——在 Midjourney 渲染图片(25 分钟)

打开 Midjourney,贴上 prompt,开始跑。下面这个批量技巧是最省时的:

  1. Fast mode/settings → 关掉 Variation Mode: HighStylize 调到 Medium。默认的 Stylize: High 出图很美,但会慢 2–3 倍,而且对产品类素材容易过度风格化。
  2. 先用 1:1 把 8 个概念全跑一遍。 利用 Discord 的消息队列——一次性贴 8 条 prompt,连按 8 次回车,离开 3 分钟。Midjourney 会按顺序排进队列。
  3. 每张结果出来,挑最好的格子用 U1U4(upscale,放大单图),如果想看更多变体用 V(variations)。
  4. 同样的批跑一遍 --ar 4:5--ar 16:9(注意:PMax 其实不用 16:9,但我发现 4:5 竖版在 Discovery 和 YouTube 的版位上比 1.91:1 表现好,而 Midjourney 的 16:9 网格可以当作"看一下更宽的画幅"的快速校验)。

合计:大概 8 个概念 × 3 个比例 = 24 次生成,再加上少量重跑(碰到不对路的图)。不刷自己渲染结果的话,25 分钟是现实的。你一定会刷。

第 4 步——放大并导出(5 分钟)

挑完赢家之后,放大到最大分辨率然后下载。Midjourney 默认输出是 1024×1024,不够 PMax 要求的 1200×1200,所以用 Upscale (Subtle)Upscale (Creative)——生活方式类用 Creative 没问题,产品图用 Subtle 更稳。

全部丢到一个 Google Drive 文件夹里,用素材组的名字命名。这一步先别想着怎么整理——等确定哪几张进最终素材的时候再改名。

第 5 步——生成文案变体(Claude,5 分钟)

到这里,你手里已经有第 1 步 brief 给的 5 条标题、5 条长标题、5 条描述。别直接用。它们是起点,不是终点。原因:第 1 步的输出有点"AI 营销腔"——听起来对,但没有那种让用户点击的具体摩擦力。

把它们再丢回 Claude 要变体:

这里有 5 条标题、5 条长标题、5 条描述。请为每条再生成 3 个变体,每个变体要聚焦一个具体的客户痛点或使用场景。用具体的语言——把问题点出来,把场景点出来,把感受点出来。避免"提升你的日常""焕新你的空间"这种通用表达。目标是说出来像是一个真实的人在跟朋友讲话。

这第二遍 prompt 让你手里文案选项翻倍。每种挑最好的 5 条,15 个文案槽位就齐了,而且每一句都带质感。

第 6 步——上传、评分、迭代(10 分钟)

打开 Google Ads 的素材组面板,把东西全传上去。Google 的"素材强度"会从"差"走到"一般"再到"好",随着你把槽位填满。别停在"好"——推到"极佳",方法是再加一张图、换掉一条弱标题、把任何显得泛泛的描述替换掉。

如果文件命名规范、素材组本身已经存在,整个上传和清理大概 10 分钟。新建素材组的话更接近 20 分钟。

容易踩的坑(以及怎么修)

团队第一次跑这条流水线通常会出三种问题。都能修。

品牌一致性在第 1 张图看着挺好,到第 12 张就崩了。 Midjourney 的风格在一个 session 内是一致的,但跨 prompt 会漂移。修法:先选一张"主图"(hero image)把你要的感觉定死,然后用它的 seed,或者把它的 URL 喂给 /describe 提取一个风格锚点,再粘到其他 prompt 里。Midjourney v6 有个更直接的方式——--sref [URL],传你最好那张图的 URL,后面的生成就会继承那个美学调性。

带文字的图片总是出 bug。 Midjourney 写文字是出了名的烂。如果你的图片概念里要在图上叠一行标题,别浪费时间反复重跑去拿一张"文字不出错"的图——去 Canva 或 Figma 里后期加文字就行。PMax 允许文字叠层,而且带文字叠层的素材通常是素材组里点击率(CTR)最高的那批。

"极佳"素材强度 ≠ 极佳表现。 Google 的这个评分衡量的是多样性和配额覆盖度,不是创意质量。我见过"极佳"素材组跑不过"一般"素材组,原因是每张图都是炫酷的 Midjourney 渲染,根本看不到产品本身。修法:20 张里至少 4 张要是真实产品图或者能清楚看到产品的图。AI 生成的生活方式图用来拓量没问题,但底层的转化版位上,必须有真实产品图来兜。

这一次省下来的一小时

如果用传统方式搭这个素材组,流程是这样的:写 brief 文档、跟设计师开 kickoff 会、2–3 轮修改、客户审批、最终导出、上传。实际算下来,2–3 个工作日,分散在一周里。

用 Claude + Midjourney 的流水线,这一小时里我大部分时间花在创意决策上——推哪些概念、留哪些渲染图、磨哪段文案。"把东西做出来"那部分大概占 20% 的时间。"决定做什么"的部分还是占 80%——这本来就是应该的比例。

老实说有一个适用前提:这套适合有视觉化产品、品牌调性清晰的 DTC/B2C 品牌。 B2B 卖抽象服务的,AI 图像生成就不合适——你用 Claude 跑文案那一半,Midjourney 那部分直接跳过,改用图库或真实拍摄。

另一个前提:AI 生成的素材组在花真钱投放之前,还是要过一遍人工审核。让品牌方过一遍,法务过一遍(文案里有任何承诺的话),最好让几个真实客户也看一眼。流水线负责出量,你身边这些人负责判断。

一小时是真的。下一个素材组试试,然后回来告诉我哪里崩了。