SEO

规模化做内链:让 Claude 直接读你的 sitemap.xml

规模化做内链:让 Claude 直接读你的 sitemap.xml
目录

去年冬天,一个电商客户找我:312 篇博客,文章之间几乎没有内链(internal links,即站内互联)。多数文章都是"孤岛页"(orphan page)——Google 只能靠 sitemap 和外链发现它们。这个站自然流量已经停滞 6 个月。我们用两个下午加了大约 1400 条上下文内链。下个季度结束时,被动过的页面平均自然曝光 +38%,其中 22 个在主关键词上至少上升了一位。

说这个不是显摆。是想说明:整个动作加起来花了 4 个小时,99% 的时间都是 Claude 在读他的 sitemap。人工做这个量级的内链是做梦,做 20 篇你的脑子就糊了。

这个工作流我已经用过 3 次,效果都不错。50 篇的博客到 5000 篇都适用。变的只是 Prompt,流程本身不变。

第一步:导出 sitemap,只留 URL 和标题

大部分 CMS 都会在 /sitemap.xml 生成 sitemap。WordPress 用 Yoast 或 RankMath 就有。Webflow、Shopify、自研系统路径通常也很直白。

用任意文本编辑器打开 XML,你会看到一堆 <loc> 条目。我把它们整理成两列 CSV:URL、文章标题。这就是你的工作文件。其他字段——lastmod、priority、changefreq——这次都用不上。

如果你的站比较大,sitemap 可能是一个 sitemap index,里面指向好几个子 sitemap。把它们拼起来。5000+ URL 的站我一般按 200-300 一批处理,避免 Claude 上下文(context window,可以理解为模型"一次能读多少字")混乱。

第二步:为你要做的那一簇内容画一张"邻里地图"

这一步是大多数人跳过的,也正是"瞎连"和"真有用"的边界。挑出网站上主题边界清楚的一角。我那个电商客户做的是"球鞋选购指南"——大约 80 篇。换成 B2B SaaS,可能就是一个产品支柱页 + 它下面的所有支撑页。

只把这一块的 CSV 导出来。手填或写个小脚本,再加两列:主关键词,外加一句话——这篇文章实际回答了什么。文件里的一行长这样:

URL: /blog/best-running-shoes-marathon
Title: 8 Best Running Shoes for Marathons in 2025
Primary keyword: best marathon running shoes
Answers: 我是 sub-4 跑者,应该买哪双马拉松跑鞋?

那一句"回答"列才是关键。它让 Claude 能判断一条链接到底是"勉强相关"还是"真的相关"。没有这一列,模型默认会按"长得像"来连。

第三步:把这个文件 + Prompt 一起丢给 Claude

我用的 Prompt(稍作了精简):

你是一位 SEO 策略师,正在审阅客户网站上的一组主题聚类。
这组聚类的主题是 [TOPIC]。目标读者是 [AUDIENCE DESCRIPTION]。

我附了一份 CSV,包含这些列:URL、标题、主关键词、
一句话描述(这篇文章实际回答了什么)。

对每一行,请推荐同文件里 3-5 个**其他行**作为内链**指向**这一页,并给出:
- 精确的锚文本(必须读起来自然,不能堆关键词)
- 一句话理由,说明这条链接为什么相关
- 在源文章的哪个位置放最合适(开头 / 某个具体的 H2 / 结尾)

规则:
- 跳过明显的导航链接(首页、关于、联系)。
- 不要建议两篇文章互相链接又互相链回来(不要互链垃圾)。
- 如果聚类内没有合适候选,写"无强候选"——别硬凑。
- 输出 markdown 表格。每个源页一行。

每个聚类我都开新对话。跨聚类的建议很容易跑偏,表格格式也方便扫读。

第四步:应用,但保留人工否决权

Claude 的输出,按我经验大约 75% 可以直接用。剩下 25% 集中在三种失败模式:

  • 主题漂移。 它连两篇文章只是因为它们共享一个词,而不是因为读者真的会点。"建议放在源文章哪里"那一列通常能暴露这个问题——如果建议位置很牵强,直接砍。
  • 锚文本堆砌。 "best marathon running shoes" 是不错的锚文本。一段里出现三次 "best marathon running shoes for beginners" 就不行了。改掉那些一看就是 2012 年 SEO 公司写的锚文本。
  • 互链垃圾。 Prompt 里我明确说了不要做,Claude 大概 80% 的时间会听话。剩下 20% 它会很高兴地建议 A→B→C→A 这种环。我盯着表格扫一遍环路,直接断掉。

我每次坐下来应用 10-15 篇。打开文章、找到建议位置、粘贴或改写链接、下一条。熟练之后每篇 3-5 分钟。

第五步:爬一遍,验证

别只信模型。要验证。改完之后上线,跑一次 Screaming Frog 或 Sitebulb,检查三件事:

  1. 这个聚类里没有孤岛页了。 聚类内的 PageRank 应该是连通图(一张互相连着的网),不是以少数几篇为中心的星形结构。
  2. 没有新增的重定向链。 相当数量的"内链"实际上指向 301 过的 URL。Claude 不知道你的 .htaccess(Apache 服务器配置文件),你知道。
  3. 锚文本分布有变化。 抽 50 条新链接看看。如果 40% 用了完全一样的锚文本,你过度优化了。改一改再继续。

我一般等 4-6 周再判断效果。内链是个慢杠杆(slow lever,指见效需要时间的优化手段)。如果某篇文章两周内跳了一位,那通常是 Google 在重新抓取和重新评估,不是结构性效果。

这个工作流搞不定的情况

三个我实际撞到过的边界:

  • 没有清晰聚类的支柱页。 如果你的站没有主题分群——如果所有东西都是"什么话题都写的博客"——Claude 会凭空造出根本不存在的聚类。先修站点架构,再跑这个流程。
  • 内容太薄。 如果源文章只有 200 字,你根本无处放链接。Claude 会建议位置,你会意识到这篇文章要重写。可以——但那是重写,不是内链。
  • 时效性强的页面。 新闻稿、"今天发生了什么"这种内容,链接图还没稳住就过时了。我直接跳过。内链是做给常青内容(evergreen content,指长期不过时的内容)的。

最后说一句

内链是 SEO 杠杆里成本最低、最可控的一条。链接放在哪、锚文本写什么,你说了算。不用建模,不用找外链,不用发邮件。多数团队不做这个,不是因为没用,是因为它无聊、重复、看起来要花一辈子。

一辈子不至于。一个 sitemap + 一个下午通常就够了。