SEO

把 GSC + GA4 导出表喂给 Claude:一套 4 步内容分析工作流(以及它能回答的 3 个问题)

2025年3月9日

上个季度,我把这套工作流跑在一个 1,200 个 URL 的电商目录上 —— 这个网站已经被三家代理公司"SEO 优化"过三轮。90 分钟后,我拿到了一份 47 个页面的清单:要么和带来流量的搜索词完全对不上,要么用户进来就走、根本留不住,要么只要重写一遍就能把流量翻倍。那三家代理的方案还停留在草稿阶段。

诀窍没什么神奇的。就是把 GSC(Google Search Console,谷歌站长工具)和 GA4(Google Analytics 4,谷歌分析 4)当作喂给 Claude 的原始数据源,而不是给你"阅读"的看板。两份免费导出、一个好的 Prompt、三个你真正需要回答的问题。

下面就是这套工作流。

先说 3 个问题(让你知道自己在搭什么)

在动第一份导出之前,我会先写下自己想搞清楚什么。没有目标的话,Claude 只会做"总结" —— 而这正是把 3 万行电子表格的 token 预算浪费掉的最快方式。我反复回到的工作流,稳定地回答这 3 个问题:

哪些页面的搜索词和页面实际内容对不上? 经典的搜索意图错配(下称"意图错配")问题。一个标题叫"2024 最佳跑鞋"的页面,引来的搜索词却是"跑鞋鞋带系法"。这种流量永远转化不了。
哪些页面有自然搜索流量,但用户进来就走? 有访问,但用户快速跳出、几乎不滚动、直接离开。要么是解决了错误的问题,要么是答案被埋得太深。
哪些是 8-20 名的快速突破机会(quick win)? Google 第二页、展现量还不错的页面。一小次改写、新加一个 H2、再补 200 字 —— 这种动作回报最快。

如果一轮 Claude 对话下来,3 个问题里一个有用的回答都没拿到,那要么是 Prompt 写错了,要么是数据没正确加载。这是标准。

第 1 步:拉两份导出(10 分钟)

你只需要两份 CSV,范围卡紧。不要全量倒。

从 GSC → 效果报告:

时间范围:最近 90 天(够长,能抹平周级别的波动;够短,大多数网站不会超过 5 万行)
维度:搜索词和页面,分开导出
筛选:展现量 ≥ 10(把那些只是统计噪声的长尾干掉)
导出:把行数限制拉到 1,000 行。如果超过,按展现量倒序导出前 1,000 行 —— 接受你是在用分布的头部做决策。

这时你有了两份 CSV:gsc-queries.csv 和 gsc-pages.csv。

从 GA4 → 网页和屏幕报告:

时间范围:同样的 90 天
维度:网页路径 + 屏幕类
指标:浏览量、互动会话数、平均互动时长、互动率、关键事件计数(如果配置了 purchase 或 sign_up 这种关键事件)
筛选:浏览量 ≥ 50(不要在只有 12 个会话的页面上做决策)
导出:CSV,行数限制同样要克制

这就是 ga4-pages.csv。

两份数据之间的连接键是页面 URL。这点很关键,因为 GSC 和 GA4 归一化 URL 的方式不一样 —— https://example.com/shoe/、https://example.com/shoe、https://example.com/shoe?utm_source=newsletter 是同一个页面。先在电子表格里清洗一下:全部小写、去掉 UTM 参数(utm_*)、去掉末尾斜杠、去掉协议和域名,只留路径。

第 2 步:合成一张平表(15 分钟)

不要把三份文件一起塞给 Claude 然后让它"join"。这种做法有时候能成,剩下的时间都在幻觉。先在电子表格里 join 完。

搭一张主表,包含这些列:

页面路径	总点击数(GSC)	总展现数(GSC)	平均排名(GSC)	头部搜索词(GSC)	浏览量(GA4)	互动会话数(GA4)	互动率(GA4)	平均互动时长(GA4)

"头部搜索词"那一列值得多花一分钟 —— 先按页面、再按点击数降序排 GSC 搜索词导出表,然后把每个页面的第 1 名搜索词抽到新的一列。就是这个字段,让"问题 1(意图错配)"可回答。

如果总行数超过 2,000 行,做个采样。1,200 行是 Claude 分析上下文的甜区。超过这个,会得到"总结的总结"问题 —— 答案会开始变虚。

第 3 步:Prompt(真正的工作,30 分钟)

下面是我用的模板,不变和需要替换的部分我都加粗了。

System Prompt(系统提示词):

你是一名内容策略师,正在审计一个网站的自然搜索表现。
你会收到一张 CSV,每行一个页面,包含:
- Google Search Console(GSC)指标:点击数、展现数、平均排名、头部搜索词
- GA4 指标:浏览量、互动会话数、互动率、平均互动时长

请就每个页面回答 3 个具体问题:
1. 意图匹配:这个页面的头部搜索词和页面主题一致吗?
   标记不一致的页面。
2. 互动健康度:在当前流量下,这个页面留住用户了吗?
   标记那些"高浏览量但低互动率 / 低平均互动时长"的页面。
3. 跃升距离(striking distance):这个页面是否排名在 8-20、展现量尚可?
   这些是杠杆最高的改写目标。

请以结构化表格输出。对每个标记的行,给出:
- 页面路径
- 标记类型(1、2、3,或组合)
- 具体理由(引用数字)
- 一条具体的改写建议

要严格。没什么问题的页面不要标。我宁愿拿到 30 条明确的标记,
也不要 200 条模糊的。

User Prompt(用户提示词):

这是数据。按 3 个问题做审计。

<把主表 CSV 贴在这里>

除了逐页的表格,请再用 5 个 bullet 总结跨页面的整体模式,
是我看单页看不出来的。

"5 条跨页面模式"那个追问,是最稳定地产出最有价值内容的地方。逐页表格告诉你周一改什么。跨页面模式告诉你这个网站结构上哪里出问题了 —— 多个内容单薄的页面抢同一个意图、一个品类模板在主动毁掉互动、14 个搜索词暴露出来的内容缺口。

第 4 步:跑第二轮迭代(30 分钟)

不要停在第一轮回答。第一轮只是一份草稿。再跑两个追问:

追问 A —— 压力测试标记。 "对每一条你标为'意图错配'的页面,看一下前 3 个搜索词(不只第 1 个),告诉我标记是否依然成立。意图不总是单搜索词的。"

追问 B —— 量化潜力。 "对所有'跃升距离'的标记,假设每个页面从当前平均排名升到第 5 名,估算点击数提升。用 GSC 在当前排名上的展现量作为锚点做这个数学。"

第二个追问,是把这件事从"一次审计"变成"一份商业论证"的关键。一个展现 4,000、排名第 12 的页面,大约值排名第 18 的页面的 2 倍流量。把这算在一个 30 页的列表上,再附上粗略的美元估算,就是一份真正会被落地的产物。

需要注意的几件事

如果不提前预判,有几个地方会出问题:

Token 上限。 2,000 行的表 + 系统提示词 + 分析,在 Sonnet 或 Opus 级别模型上会跑 20 万 - 40 万 token。确认你的套餐能扛,或者按网站分区切分,分轮跑。不要试图压缩表格 —— 模型需要这些数字。

PII 与合规。 GA4 导出表里不应该有个人身份信息(你已经这样配了吧?),但粘贴前再确认一下。一不小心把客户邮箱喂给第三方 LLM 的那天,是个糟糕的日子。

模型会过度标记。 对任何"标记类型 2"但只有 200 个浏览量的页面保持怀疑。这个数据量不够下判断。在行动前,按流量过滤一遍标记。

GSC 数据有滞后。 GSC 滞后 2-3 天。不要用还在波动的数据做决策。

不要盲信改写建议。 Claude 的改写建议是基于模式,不是编辑判断。用它当起点,不是终稿。尤其在 E-E-A-T(经验 Experience、专业 Expertise、权威 Authoritativeness、可信 Trustworthiness)真的重要的领域 —— 健康、金融、法律 —— 改写依然需要懂行的真人。

如果让我重新开始

如果重来,我会加第三份导出:用 Screaming Frog 抓一遍页面标题和 H1。把页面上看到的标题和头部搜索词、互动指标一起喂给 Claude,会把"意图错配"问题从"头部搜索词和 URL slug 对不上"升级成"头部搜索词和真人会看到的 H1 对不上"。这一列,比工作流里其他任何部分,抓到的错位都多。

我开头说的 90 分钟,默认你已经跑过三四遍了。第一次会花两到三个小时 —— 大部分时间都在和 CSV 导出搏斗、找对的行数限制。到第三个网站,这是 90 分钟的肌肉记忆。到第十个,你会注意到不同垂直领域里反复出现的相同模式 —— 这才是工作真正复利的时候。

这就是工作流。两份免费导出、一个 Prompt、三个问题、90 分钟。在下一次季度评审之前跑一次,不要等评审之后;和利益相关方的对话,会从"我们是不是该做个内容审计"变成"这是 Q2 我们要重写的 30 个页面"。

Twitter LinkedIn Facebook Reddit Email

UTM 卫生审计:破损、重复、互相蚕食的标签(1,000 条 URL,Claude) AI 内容刷新：一个周末用 Claude + GSC 更新 200 篇旧文 Claude Computer Use 代理：每天监控前 20 个关键词排名，有变化就 Slack 告警用 Claude + 排名前 10 的页面做出匹配 SERP 的内容简报