Marketing

AI 邮件送达率审计:10 分钟内诊断 10000 封邮件

AI 邮件送达率审计:10 分钟内诊断 10000 封邮件
目录

打开仪表盘的时候,警报已经先我一步响了:打开率 14%——上周还是 38%。点击率 0.6%,几乎不忍直视。一个客户刚用全新的发件域名推了 22000 封 Black Friday 邮件,Gmail 在 48 小时内把邮件从「收件箱」一路挪到「促销」,最后归到「垃圾邮件」。客户的项目经理要解释,CEO 要找 ESP(Email Service Provider,邮件发送服务商)要退款。我要的是十分钟,和一个终端窗口。

下面是我现在为每个新发件账号、每个曾经突然送达率暴跌的域名跑的审计流程。它不是万能的——完整的送达率深度排查要一周和一个种子邮箱列表。但它能稳定抓住 80% 真正重要的问题,工具全是免费的,外加一条写得讲究的 Prompt。下面是完整操作手册。

10 分钟审计能抓什么、不能抓什么

快速审计是分诊,不是治疗。它能稳定抓到的:

  • 认证配置错误 — SPF、DKIM、DMARC 缺失或配错
  • 黑名单上榜 — 你的发件 IP 或域名上了公开拒收名单
  • 明显的内容垃圾信号 — HTML 损坏、纯图片邮件、垃圾主题行模式
  • 发件人信誉红灯 — 退信率飙升、投诉率超过 0.1%
  • DNS 卫生问题 — 反向解析缺失、MX 记录指向错误、悬空 CNAME

无法稳定抓到:

  • 收件箱位置(Inbox vs Promotions vs Spam)— 这需要真实邮箱组成的种子列表
  • 订阅者层的互动质量 — 需要 ESP 端分析
  • 长期信誉趋势 — Postmaster Tools 需要 30 天以上历史数据
  • 收件方域名的节流行为 — 只有收件箱位置测试能看见

如果快速审计全部干净、邮件还是进垃圾箱,那问题在下面那个分类里。把种子列表工具(GlockApps、InboxAlly、Mail-Tester)留给第二轮。10 分钟版本是用来快速抓到那些「低级错误」的。

按顺序检查的 6 个信号

我做了 15 年这件事。前十年是手动跑、顺序还跑错过,漏掉真正重要的东西。AI 让我能把已知该查的东西并行起来。顺序这件事是花了一万小时才学会的。

1. 认证:SPF、DKIM、DMARC——必须存在的三条记录

每个发件域名需要三条 DNS 记录。2026 年还缺任何一条,就是在自找进垃圾箱——Gmail 和 Yahoo 在 2024 年 2 月就把 DMARC 强制要求写进了批量发件人规则,之后执行只严不松。

60 秒检查(一次跑完三条):

bashdig TXT +short yourdomain.com | grep spf
dig TXT +short selector._domainkey.yourdomain.com   # 你的实际 selector
dig TXT +short _dmarc.yourdomain.com

你该看到的:

记录 作用 合格答案
SPF(Sender Policy Framework,发件人策略框架) 列出允许代表本域名发件的 IP v=spf1 include:_spf.your-esp.com -all-all 至关重要,~all 太软)
DKIM(DomainKeys Identified Mail,域密钥识别邮件) 加密签名,证明邮件未被篡改 v=DKIM1; k=rsa; p=MIIBIjANBgkqhkiG9w0BAQEFAAOC...(一段长长的公钥)
DMARC(Domain-based Message Authentication, Reporting & Conformance,基于域的邮件认证、报告与一致性) 告诉收件方 SPF/DKIM 失败时该怎么办 v=DMARC1; p=quarantine; rua=mailto:dmarc@yourdomain.com(起步用 quarantine,不要用 none

如果只能用一个工具,把这三条过一遍 MXToolbox 的 SuperTool——它把三次查询合并成一次,用大白话标出配置错误。免费版每天 100+ 次查询。我用这个页面抓到的 DKIM selector 不对齐、SPF 忘记写 -all 的次数,多到不想承认。

AI 可以并行做的检查: 把三条记录贴给 ChatGPT,让它判断:「这三条记录是否完整、是否正确对齐通过 [你的 ESP 名称] 发件、Gmail / Microsoft / Outlook 会不会接受这套配置?」模型能抓到一些肉眼容易漏的——比如 SPF 超出 10 次解析上限这种隐蔽坑,或者 p=none(本质上是给收件方的备忘录,不是指令)。

2. 黑名单:你是不是已经在公开拒收名单上了?

最让人意外的就是这一项。打开率掉了 30%,大家以为是内容问题,与此同时你的发件 IP 从周二起就在 Spamhaus 上挂着了。然后「修邮件」的第一小时,全浪费在调主题行上了。

30 秒检查:

  • MXToolbox 黑名单查询 — 贴入发件 IP,一次过 50+ 黑名单
  • Spamhaus 移除申请 — 如果上榜,移除申请就在同一页
  • MultiRBL.valli.org — 备选交叉验证,有时能抓到 Spamhaus 漏的

要查的 IP 是你的 ESP 用来发件的那些。如果你在共享 IP 上(大多数 ESP 默认这样),上榜可能不是你的错——但它一样影响你的送达。共享 IP 信誉出问题,是下次续约时该转专用 IP 的强信号。

3. 退信码拆解:硬退信、软退信、以及那些骗人的退信

退信码是邮件服务器告诉你的故障原因。多数团队忽略它。这是大错。某个退信码突然飙升,往往直接指向真正的问题——而且各邮箱提供商的编码没有标准化,你需要一个翻译。

3 分钟检查:

从 ESP 拉最近 10000 次发送的退信日志,按退信码分组。你要看的拆解:

  • 硬退信(5.x.x 码) — 收件地址永久失效。应该立刻抑制,不是「管理」。一次发送的硬退信率超过 2% 就有问题。
  • 软退信(4.x.x 码) — 临时故障(邮箱满、服务器宕、灰名单)。少量正常;突然飙升意味着收件方域名在节流你。
  • 拦截码 — 收件服务器明确拒收。常见模式:550 5.7.1(信誉)、554 5.7.1(内容)、521(IP 拦截)。编码就能告诉你是哪个系统拦截的。
  • 垃圾投诉码(feedback-loopabuse-report — 收件人点了「标记为垃圾邮件」。这是整份报告里最伤人的数字。超过 0.1% 你就进了 Postmaster Tools 危险区;超过 0.3%,Gmail 会开始批量过滤你。

AI 捷径: 把 Top 20 退信码(带计数)贴进 ChatGPT,提示词这样写:

你是一名高级邮件送达率分析师。这是来自 10000 发送量的退信码汇总:[贴数据]。请对每个码做分类(硬退信/软退信/拦截/投诉),解释含义,并按对发件人信誉的影响排出前 3 大问题。每条给一个具体修复建议。

模型不知道你的发件历史,但它对 SMTP 编码体系了如指掌。30 秒出一份分诊报告,给初级营销人干要半天。

4. 内容信号:垃圾邮件过滤器眼中的你的邮件

垃圾邮件过滤器在打分。看具体模式:图片文字比、链接数量、HTML 结构、主题行措辞。这些大部分是公开的常识。难点在于触发规则会随垃圾邮件制造者进化、过滤器重训而变化。

5 分钟检查:

把邮件发到 Mail-Tester(mail-tester.com)——免费服务,满分 10 分。8+ 就健康;低于 6 意味着至少有重大问题。

要做更细的诊断,把邮件正文跑一遍这个 ChatGPT Prompt:

你是一名邮件送达率分析师。这是一封出站邮件的 HTML 源码:[贴源码]。请按这 6 个维度打 1–10 分:(1) 图片文字比,(2) 链接数量与目的地多样性,(3) HTML 干净(无破损标签、无 Word 输出、无纯图片设计),(4) 主题行垃圾触发词(紧迫词、全大写、过度标点、emoji),(5) 是否带纯文本替代版本,(6) 是否带取消订阅头。低于 7 分的,逐条给出具体修复建议。

自审时具体该看什么:

  • 纯图片邮件 — 整封邮件是 600KB 的 PNG,没有文字回退。几乎注定进垃圾箱。
  • 短链服务 — 营销邮件里放 bit.ly、t.co。垃圾过滤器默认你在藏目的地。
  • 「点击查看」+ 纯图片设计 — 最差组合。预览时好看,打开就被过滤。
  • 主题行里三个或更多垃圾词 — 「免费!!」「立刻行动」「限时」(是的,「限时」现在也是软触发)。一个能原谅,三个是模式。
  • 缺少 List-Unsubscribe 头 — Gmail 对批量发件人强制要求。多数 ESP 自动加,但值得在原始头里确认。

5. 发件人信誉:Gmail 和 Microsoft 真正怎么看你

Gmail 对每个在 Postmaster Tools 注册的发件人都有域名和 IP 信誉打分。Microsoft 自己在 SNDS(Smart Network Data Services,智能网络数据服务)里也有。两个都免费,两个都说真话。

2 分钟检查(最好两个都做):

  • Gmail Postmaster Tools — 注册域名并验证,然后看:域名信誉(High/Medium/Low/Bad)、IP 信誉、垃圾率、认证通过率、反馈环投诉。仪表盘延迟 24-48 小时,所以你今早看到的是两天前的数字。但这仍然是你能拿到的最诚实的信号。
  • Microsoft SNDS — 注册发件 IP,每天拿过滤率、投诉率、陷阱命中数据。
  • Sender Score(senderscore.org) — Validity 的免费信誉分,0-100。低于 80 是警告;低于 70 意味着邮箱提供商已经在节流你。

如果你的 Gmail 域名信誉是「Low」或「Bad」,你面对的是信誉问题。没有任何内容调整能救。修复需要几周的干净发件(只发高互动列表)、清理非活跃用户、可能还要换 IP。审计前 10 分钟就知道这一点,能让你免掉一周无效的主题行优化。

6. 互动质量:谁真的在打开(以及怎么办)

前五个信号都是关于「你」——你的配置、你的内容、你的信誉。这最后一个是关于「他们」——你的订阅者。说实话,这是决定长期送达率的那一个。

2 分钟检查:

从你的 ESP 拉:这个列表里过去 90 天打开或点击过的占多少?数字低于 20%,列表就是死的。往死列表上发,是拖垮你信誉的最大单一因素,任何认证工作都补不回来。

标准补救:

  1. 日落流(sunset flow,沉睡用户清理流程) — 90 天没打开的人,进 3 邮件再激活序列,措辞一次比一次更直接:「还想收吗?」最后那封是分手信:「回复就留下;不回复我们就不发了。」不回复的全部抑制。
  2. 基于互动的分层 — 高打开者进主促销列表。中打开者降低发送频率。非打开者进日落流或不发。
  3. 灰度用户重新授权 — 90-180 天未活跃是灰度区。一波一次性「我们正在清理列表,要留下吗?」再确认活动,能重建一个更紧、互动更高的基础。

30000 人的列表,8000 个活跃打开者;比 100000 人列表、5000 个活跃打开者,在每个真正有意义的指标上表现都好。列表规模是虚荣心,列表互动是真金白银。

完整 10 分钟操作手册

这是真正能一个人坐下来跑完的顺序:

分钟 动作 工具
0:00–1:30 拉 DNS 记录,验证 SPF/DKIM/DMARC dig + MXToolbox SuperTool
1:30–2:30 检查发件 IP 是否在 50+ 黑名单 MXToolbox 黑名单 + MultiRBL
2:30–5:00 拉最近 10K 退信日志,按码分组,Top 20 贴给 ChatGPT 分诊 ESP 后台 + ChatGPT
5:00–6:30 发测试邮件到 Mail-Tester,拿分 mail-tester.com
6:30–8:00 把邮件正文跑一遍内容分析 ChatGPT Prompt ChatGPT
8:00–9:00 拉 Gmail Postmaster 信誉 + Microsoft SNDS Postmaster Tools + SNDS
9:00–10:00 从 ESP 拉 90 天互动,识别日落候选 ESP 后台

如果全干净,你就有了 10 分钟的证据,能给客户(也给你自己)证明:配置没问题,问题在别处。如果哪项没通过,你拿到的是按影响力排序的修复清单。

出问题时的升级顺序:

  1. 黑名单上榜 — 申请移除,然后继续
  2. 认证记录缺失或损坏 — 修 DNS,等 1-24 小时传播,重测
  3. 硬退信率 > 2% — 清洗列表,重新抑制死地址,重发
  4. 垃圾投诉率 > 0.1% — 暂停发送,跑列表清洗活动,配置好日落流后再重启
  5. 域名信誉 Low 或 Bad — 硬骨头。启动 30 天信誉重建协议(只发互动列表、不发冷邮件、每日监控)
  6. Mail-Tester < 6 分 — 内容重写;通常是一个具体元凶(一个坏的短链、一个纯图片布局)

自审时容易踩的三个坑

首次做审计的人总会掉进同一类陷阱:

坑 1:把收件箱位置和送达率搞混。 99% 的送达率听起来很美。但 60% 的送达可能都进了垃圾箱,用户永远看不到。送达率回答的是「收件服务器接没接?」收件箱位置回答的是「邮件落到了用户能真正看到的地方吗?」这是两个数字,第二个才决定 ROI。如果你的送达率很高、打开率却远低于行业基线,问题就是收件箱位置。

坑 2:相信 p=none 的 DMARC 策略。 p=none 的意思是「认证失败时啥也别做,告诉我一声就行」。这是一个监控设置,不是安全设置。Gmail 和 Yahoo 在 2024 年截止日接受了它,但 p=quarantine 才是真正防护的底线。确认认证干净后(先跑一遍审计——如果 SPF/DKIM 坏了,切到 quarantine 会开始把你自己的合法邮件也一起隔离),立刻从 none 升到 quarantine

坑 3:治标不治本。 「修 SPF 记录」这种建议几乎从来都不是终极答案。问题在于 SPF 为什么会坏——通常是团队 6 个月前加了一个新的发件服务却没更新记录。审计是快照,原因是一个流程漏洞。把修复结果记在团队下一个人会看到的地方(Confluence、Notion、Runbook)。不然 8 个月后另一个人加了另一个发件服务,你会再跑一遍同样的审计。

这套框架值得留下的部分

开头那个客户——Black Friday 翻车的那位——11 分钟跑完了完整审计。三个发现:他们的 DKIM selector 在上个月切 ESP 时被悄悄错转了(Gmail 看到的 40% 邮件是无签名的);他们的发件 IP 和另外三个客户共享一个 /24 网段,其中一个在 Spamhaus 上挂着;他们的 90 天互动是 9%,意味着即便认证全干净,也是在逆风局。

20 分钟修了 DKIM,对 IP 段提交了移除申请,跑了一轮日落流,两周内抑制了 67% 的列表。两周后的下一波活动,列表更干净、认证重建完成,打开率回到 31%。

教训不是 AI 替代了我的判断。AI 干的是并行活——DNS 查询、退信码分类、内容打分——把我省出来的时间花在判断上:哪些修复重要、按什么顺序、以及什么时候该怼回那个想「下周二就给所有人重发」的客户。10 分钟的工具 + 10 分钟的优先级判断,通常比单独 10 小时的任何一边都强。