用 AI 抓出内容自相残杀,别等排名掉了才发现
目录
上个季度,一个 SaaS 客户找到我——自然搜索流量在 90 天里掉了 18%,但他们后台"看起来一切正常"。没有算法更新。没有大改内容。外链也稳得很。他们连续两年每周发一篇博客,慢性失血终于跨过了能被察觉的那条线。
我把他们的 Google Search Console(谷歌搜索控制台)导出拉出来,跑了一下我下面要描述的这个工作流。40 分钟后,我们有了一份 11 对的清单——同一个查询词被他们站内的 2 到 3 个页面在不同周轮流接住。典型的内容自相残杀(content cannibalization,关键词蚕食)。我们合并了 5 对,做了 3 个 canonical(规范链接)指向,剩下的把搜索意图重写区分开。六周后,同一批内容的流量涨了 22%。
内容自相残杀——指你自己站内两个页面争同一个查询词——是我做 SEO 15 年里见过最安静的杀手之一。它几乎从不以"突然大跌"出场。它的样子是慢性失血,大多数团队等到丢了一个季度收入才反应过来。下面是我用来早期发现它的 AI 辅助工作流。
症状:你的页面在轮流上榜
进工作流之前,你得先认得出这个模式。自相残杀几乎从不像"这个页面消失了"。它长这样:
- 排名来回跳。 A 页面这周 "best CRM for startups" 排第 6,B 页面下周排第 8,再下周 A 又回到 11。
- 第二页同时出现两个 URL。 一个查询你本该稳吃,结果两个页面都卡在 12–18 之间。
- 排名没变但 CTR 在跌。 平均位置看着没动,但点击量一路下滑——因为谷歌在测试不同 URL,没一个是搜索者一眼就认的那个。
- 排上去的是错的 URL。 一篇 600 字的博客盖过你详细的支柱页,赢了一个高商业意图的查询词。
只要你数据里有以上任意一种模式,下面的工作流能把具体的"对"挖出来。
第 1 步——从 GSC 拉出对的那一刀数据
打开 Google Search Console,进 Performance → Search results。把时间范围设到近 90 天(28 天太吵;6 个月又把信号埋在旧内容里)。然后按下面这些维度导出:
- Query(查询词)
- Page(页面)
- 过滤:Position(排名)≤ 20(排名在 20 之外的太不稳,还不能定性为自相残杀)
你会拿到一份 CSV,一行一个"查询词–页面"组合。重点要看的形状是:哪些查询词出现了不止一个页面 URL。
如果你有 GSC API 权限(或者用 Search Analytics for Sheets 这种工具),直接拉每日原始数据更好——你能看到 URL 之间的轮换跳动,这是最强的自相残杀信号。
第 2 步——让 AI 找出"多 URL 撞车"的对
这事 Excel 用 COUNTIF 也能干,但 ChatGPT 一个 prompt 就搞定,还顺手把你本来要手动做的分析也做了。把你的 CSV(大的话分块)粘进这个 prompt:
你是一个 SEO 审计师。我会给你一份从 Google Search Console 导出的 CSV,包含列:Query, Page, Clicks, Impressions, CTR, Position。
找出所有这样的查询词:它出现在我站内 2 个或更多不同的页面 URL 上。对每一条返回:
- 查询词本身
- 所有竞争的 URL,附带各自的点击、展示和平均排名
- 一个 1–5 的"蚕食严重度"打分:
- 5 = 两个 URL 都排在 1–20,合计展示 >1000,排名差 <5
- 1 = 一个 URL 主导(点击 >10 倍),另一个几乎没存在感
- 一行注释:谷歌看起来更偏好哪个 URL(点击最多的那个),亚军离冠军差多远
按严重度降序排。输出为 markdown 表格。只出现一个 URL 的查询词不要列。
两个细节要注意。第一,那个严重度打分能省好几小时——它直接告诉你这周该修哪 10 个,剩下 50 个可以先不管。第二,让 AI 标出"偏好 URL"等于给你第 4 步的合并决策开了个头。
站点大(1000+ 个多 URL 冲突的查询词)的话,每次只塞 ~300 行进去跑。塞多了质量会掉。
第 3 步——确认是意图重叠,不只是关键词重叠
两个页面排同一个查询词,不一定就是问题。有时候一篇博客和一个产品页本来就服务不同的意图,谷歌是故意在它们之间轮换。这种情况你去合并,反而两个意图的流量都会掉。
这一步是 AI 真正值钱的地方。对每一对第 2 步揪出来的可疑组合,跑这个:
我会给你两个 URL 和它们都排到的那个查询词。从三个维度对比:
- 搜索意图匹配——每个页面分别服务的是信息型、商业型还是交易型?两边一样还是不一样?
- 内容重叠度——实质内容(标题层级、要点、案例)有百分之多少是重复或近似重复的?
- 建议动作——只能选一个:consolidate(合并成一篇)、canonicalize(保留两边,指定一个为主)、differentiate(重写其中一个,明确瞄向不同意图)、或者 leave alone(两个意图本来就该不同,别动)。
查询词:[query] URL A:[贴相关内容或摘要] URL B:[贴相关内容或摘要]
别留情面。如果两个页面实质内容重叠 60% 以上,就推荐合并。
别塞完整的 HTML——剥到只剩标题层级加每个大块的前 200 字就够了。Claude 和 ChatGPT 都能处理这种对比;我自己感觉 Claude 在区分意图细微差异上稍微好一点,ChatGPT 给出干净的动作建议更利索一点。用你已经在付费的那个就行。
第 4 步——用一个简单决策表定修复方案
第 3 步把每一对标好之后,修复路径就四条:
| AI 建议 | 含义 | 怎么做 |
|---|---|---|
| Consolidate(合并) | 重叠高,意图一致 | 把输的那个 URL 做 301 跳转到赢的那个。把输的那篇里独有的内容并到赢的那篇。更新所有站内链接。 |
| Canonicalize(规范化) | 有些重叠,意图一致,两边都有保留理由 | 在副要页面加 rel="canonical" 指向主要页面。重新提交给 GSC。 |
| Differentiate(拆分意图) | 同一个查询词,但两个页面本应服务不同意图 | 重写其中一个,明确瞄向一个子意图(比如把"best CRM"拆成"best CRM for startups"和"best CRM for enterprises")。改 title 标签、H1 和正文前 200 字。 |
| Leave alone(别动) | 两个意图本就该并存 | 啥也别干。日历上设个 90 天后再看一次。 |
"赢的 URL" 几乎永远是外链更多的那个,不是点击更多的那个。点击是当下的症状;外链是长期的资产。拿不准的时候用 Ahrefs 快速查一下两个 URL 的外链情况,向链接配置更强的那边合并。
几个要小心的地方
- 品牌词不算。 你的首页和 /about 页面都排"[品牌名] reviews",这没问题。第 1 步开始前先把品牌词过滤掉。
- 精选摘要(featured snippet)会扭曲排名。 一个 URL 是精选摘要、一个是普通蓝链时,GSC 会把它们报成不同位置,但其实不是真冲突。合并前去 SERP 里对一眼。
- 正在转化的别去修。 我见过团队把两个都排在第一页、只是细微变体的页面合并掉,结果丢的流量比"省下"的还多。如果两个 URL 都在密切相关的查询词上排前 10、合计流量还在涨,别动它们。
- 季度跑一次,不是每月。 自相残杀需要时间在数据上沉淀。月度检查制造噪音;季度检查产生信号。把它写进日历。
它真正重要的原因
自相残杀毁了那么多内容项目,根本原因不是发布团队不懂 SEO。是没人对历史文章的长尾负责。新帖每周一篇上线,编辑日历一路推进,三年后你有 400 篇文章,其中 70 篇在悄悄互相竞争。
AI 修不了这个组织上的缺口——但它把审计成本压得够低,低到你不用花 5000 美元请个外部团队就能跑一遍。一个季度 40 分钟,一个免费的 GSC 导出,一段对话窗口。这就是全部成本。难的部分一直是分析;分析现在变成了最容易的那部分。