邮件标题 A/B 测试:动笔前先建一张 15 行假设表
目录
我以前的邮件标题测试流程是:三个候选 + 抛硬币。新的流程是:先填一张 15 行的表格,一个字没写,团队已经清楚"我们到底在测什么"。
抛硬币式的 A/B 测试,在大多数 in-house 团队里依然是默认做法。有人写两条标题——"Special 50% off today" 和 "🔥 Limited time 🔥",跑一遍测试,一条以微弱优势获胜,团队就当事情结了。但其实什么也没学到。这两条标题同时改了长度、Emoji、紧迫感和语气,所以胜出者是一锅你拆不开的变量。下一次测试又从零开始,团队继续猜。
解法很简单:在动笔写标题之前,先把假设写下来。一张 15 行的表格花 25 分钟,能帮你避开未来一年"测了等于没测"的实验。
15 行假设表
15 行覆盖了所有对打开率有显著影响的杠杆,每行 2-4 个 cell,写明测试方向。下面是我常用的 15 行里的 6 行:
| # | 假设 | Control(对照组) | Cell A | Cell B |
|---|---|---|---|---|
| 1 | 移动端短标题(<50 字符)打开率更高 | "Our new collection is here — shop the 12 best pieces" | "New collection: 12 picks you'll wear all week"(44 字符) | "New collection is live"(24 字符) |
| 2 | 标题开头加一个 Emoji 提升打开率 | "Sale ends tonight" | "🎁 Sale ends tonight" | "Sale ends tonight 🎁" |
| 3 | 带收件人名字的标题打开率更高 | "Your weekly recap" | "Sarah, your weekly recap" | — |
| 4 | 具体数字比整十整百的数字更有效 | "Save 50% this week" | "Save 47% this week" | "Save 53% on your first order" |
| 5 | 方括号包起来的紧迫感标签不会在截断里丢失 | "Last chance: 24 hours left" | "[Last 24 hrs] 50% off everything" | — |
| 6 | 全小写、零标点更显个人化 | "We just shipped a new feature" | "we just shipped a new feature" | "We just shipped a new feature!" |
如果某一行的 "Cell A" 那一列你填不出来,那这一行其实不是一个假设——只是一个 vibe(直觉)。直接跳过。
剩下 9 行覆盖:疑问句 vs 陈述句、利益前置 vs 悬念前置、发件人名(品牌 vs 个人)、预览文本配合、发送时段、发送星期、分群专属文案、流失唤起话术、折扣主导 vs 价值主导。
一次发送只测一个假设
我最常看到的错误是:"这封邮件我们同时测长度、Emoji 和个性化"——这其实是一锅多变量测试披着 A/B 的皮。一次发送只挑一行,跑完,再跑下一行。
在 Klaviyo 里把测试比例设到 20%(对照组和实验组各 10%),等置信度(confidence)达到 90% 再自动发送胜出版本。一个 4 万订阅的列表每组能拿到大约 4,000 封——足以检测出 1.5 个百分点的打开率差。每组不到 1,000 封的时候,基本就是猜。
为什么先把表填好
三个理由,25 分钟的预工作是值得的:
- 写得少,测得多。 每一行只做一件事。第 4 行的文案 60 秒就能写完,而不是 20 分钟。一个季度你能跑 5-6 个可测的假设,而不是一个。
- 复利式学习。 一旦"具体数字比整十整百有效"在第 4 行被验证,下一次测试就可以跳过它,去测下一个未知。三个季度之后,这张表就是一份学习档案,而不是一份计划文档。
- 不再测 vibe。 "我觉得 Emoji 适合我们品牌"不再是一个争论题。它是第 2 行,有对照组、有实验组,数据说了算。
15 行假设表并不会取代创意判断。它只是强迫创意判断落到一个可测的声明上,而不是一个靠猜的声明上。先把表建好,再去写第一条标题,"最好的标题"这件事就不再是抛硬币。