SEO

回收 1,000 条死链:把外链的 404 批量映射到活页(Ahrefs + Claude)

回收 1,000 条死链:把外链的 404 批量映射到活页(Ahrefs + Claude)
目录

上季度我给一个客户跑了一遍这个流程:他站上有 1,047 条外链指向 404 页面。当天下午我们救回了其中 620 条的链接权重——没有开发人员写一行跳转配置。剩下 427 条没动,因为目标页早就不存在了。下面是工作流。

在 Ahrefs Site Explorer,进入 BacklinksBroken backlinks。加筛选:

  • DR(域名评级)> 20——低于这个的不值得花精力
  • 只选 "Follow"——nofollow 链接不传递权重,跳过

把全部结果导出成 CSV。每一行是一个断链,包含来源 URL、锚文本、DR、以及你域名上的死链目标 URL。

DR > 20 这个筛选是承重墙。1,047 条断链里只有约 640 条过筛。剩下 400 多条是低质量目录站和评论垃圾,根本不值得做跳转。在源头筛掉,省掉后面 400 个让你后悔的映射。

第二步——用 Claude 按主题批量归类

把 30 行一批丢给 Claude,配这段 prompt:

I'm mapping dead URLs to live pages. For each row, tell me the
TOPIC of the dead URL based on the URL slug and anchor text, and
suggest the most likely live URL on my site that should receive
the redirect.

The site is [YOUR DOMAIN]. The site has these sections: [LIST
YOUR TOP 10-15 PARENT PAGES].

Output as a CSV with columns:
broken_url,anchor,dr,topic,suggested_live_url,confidence

Confidence: "high" if the topic clearly matches an existing
section. "medium" if the URL is 80% there. "low" if you're
guessing. "no_match" if no live page is appropriate — in that
case, leave suggested_live_url blank.

Do NOT invent live URLs. If the section doesn't exist on the
site, return "no_match".

"Do NOT invent live URLs" 是关键规则。如果你不管,Claude 会很乐意把 /old-blog-post-2019 跳转到一个根本不存在的 /new-blog-post-2019。你只想跳转到真实能访问的 URL。

第三步——筛选并校验 "high" 置信度的匹配

挑出 "high" 置信度的行。手动在浏览器里访问 20 条 suggested_live_url 做抽查。如果 Claude 给的跳转目标都能返回 200,这一批就过了。

"medium" 和 "low" 置信度的行需要人工判断。"no_match" 的行需要你决定:你是有一个活页能承接这个流量(那就建一个),还是这个主题已经死了不值得复活?大部分时候答案是"死了"。

对于你决定值得复活的 "no_match" 行,你有两个选择:建一个新活页然后跳转过去,或者 410 这个死 URL 然后不再管。我几乎总是 410。把 301 跳到一个勉强相关的页面,对 Google 来说就是软 404,Google 早就表态过无数次了。

第四步——上线跳转(唯一需要开发的步骤)

把筛过的 CSV——broken_url → live_url,只含你确认过的行——交给有服务器访问权限的人。他们需要的格式:

  • Apache/Nginx——.htaccess 或服务器配置里一行一条:redirect 301 /old-path https://site.com/new-path
  • Cloudflare——通过 Rules → Redirect Rules UI 批量上传
  • Vercel/Netlify——vercel.json_redirects 文件

如果你在托管主机上(WP Engine、Kinsta 等),通常有 UI 入口。CSV 干净之后上传 5 分钟搞定。

1,047 → 620 的数字,拆开看

1,047 条断链里,620 条干净映射到一个 high 置信度的活页。剩下 427 条拆解如下:

  • ~250 条低 DR 的目录站和评论垃圾(第一步已筛掉)
  • ~120 条死主题、找不到合适的活页("no_match" 行,留 410)
  • ~57 条 medium/low 置信度匹配,我不太信、不敢跳

620 条跳转上线后,导给活页的流量不算多但真实——每月大约 1,800 个来源会话,全部来自那些 404 了好几年的链接。更大的赢面是链接权重:这 620 条跳转现在把 PageRank 注回了活站,而不是在 404 上死掉。

哪些可以跳过

别试图"抢救"低 DR 的断链。别把每个死链都 301 到首页——Google 把它当软 404。别完全相信 Claude 的建议而不抽检至少 20 条。别因为懒得找活页就直接 410 死链——Google 拿软 404 算账的。

整个活 4 步一下午。更难的工作是判断哪些死主题值得复活、哪些不值得。Claude 做批量匹配,你做编辑判断。