工具将分别以Googlebot和Chrome浏览器的User-Agent抓取页面,对比两次抓取结果的差异。
页面渲染对比工具通过分别以Googlebot和真实浏览器的User-Agent抓取同一页面,深度对比两个视角下HTML源码、Meta标签、标题、文本内容、链接和结构化数据的差异。用于检测Cloaking(隐蔽欺骗)、JavaScript渲染缺失、条件渲染等影响SEO的关键问题。
| 检测维度 | 说明 | 严重性 |
|---|---|---|
| HTTP状态码 | 两个UA是否收到相同的状态码(200/301/404等) | 严重(Cloaking信号) |
| Title标签 | 爬虫和用户看到的页面标题是否一致 | 严重 |
| Meta Robots | 是否对爬虫和用户设置了不同的robots指令 | 严重(Cloaking信号) |
| Meta Description | 描述是否一致 | 警告 |
| Canonical链接 | 两个视角的canonical是否指向同一URL | 错误 |
| H1标题 | 主标题是否一致(JS渲染常见差异点) | 错误 |
| 文本内容量 | 纯文本字数差异比例(超过50%差异为严重) | 严重/警告 |
| 链接数量 | 内链外链总数差异 | 警告 |
| HTML大小 | HTML字节数差异比例 | 警告 |
| 结构化数据 | Schema.org JSON-LD是否一致 | 警告 |
Google严禁向爬虫和用户展示不同内容。通过对比Googlebot和Chrome浏览器看到的页面,检测是否存在根据User-Agent返回不同内容的行为。故意Cloaking会导致被Google惩罚甚至移除索引。
React、Vue、Angular等SPA框架的内容依赖JS渲染。如果SSR(服务端渲染)配置不当,Googlebot可能只看到空白页面或骨架屏。本工具通过文本内容量差异直接反映JS渲染缺失程度。
网站流量突然下降时,检查是否因为服务器配置变更导致爬虫看到的内容与用户不同。例如CDN层面的Bot检测错误地阻止了Googlebot。
改版或迁移后,确认新系统对爬虫和用户返回一致的内容。特别是从静态站迁移到SPA时,SSR是否正确工作。
部署了反爬虫(WAF、Cloudflare等)后,检查是否误伤了搜索引擎爬虫。Googlebot如果收到403/503或验证页面,页面就无法被索引。
某些网站根据设备类型(移动/桌面)或地理位置返回不同内容。检查这种差异是否也影响了爬虫视角。
部署了Prerender.io、Rendertron等预渲染服务后,验证爬虫是否确实收到了完整渲染的HTML,而非JS骨架。
分析竞品网站是否使用了Cloaking手段或高级的爬虫特殊处理,了解其技术SEO策略。
提供两种模式:「🔗 输入网址检测」直接输入URL,工具自动以Googlebot和Chrome两种UA分别抓取页面并对比;「📋 粘贴HTML对比」手动粘贴两份HTML源码进行对比(适合无法直接抓取的页面或需要对比渲染前后差异的场景)。
URL模式下直接输入完整的页面地址(如https://example.com/page)。HTML模式下,左侧粘贴爬虫看到的源码(可通过Google Search Console的"URL检查→查看已抓取网页"获取),右侧粘贴浏览器看到的源码(通过Chrome DevTools获取)。
点击"🔍 对比分析"按钮。URL模式下工具会发出两次HTTP请求(分别携带Googlebot和Chrome的UA),然后深度分析两次响应的HTML内容。对比涵盖10个维度:HTTP状态码、Title、Meta Description、Meta Robots、Canonical、H1标题、文本内容量、链接数量、HTML大小和结构化数据。
结果页顶部显示0-100分的一致性得分环形图。100分表示爬虫和用户看到的内容完全一致(最理想状态)。得分越低表示差异越大。同时显示明确的Cloaking风险判断:绿色安全、橙色有差异、红色存在Cloaking风险。
差异项按严重性排列:红色为严重问题(Cloaking信号,如状态码不同、Meta Robots不同)、橙色为警告(可能的JS渲染问题)、绿色为通过项。每个差异项同时显示爬虫视角值(红色框)和用户视角值(绿色框),一目了然。
下方的并排对比面板显示两个视角的详细数据:Title、Description、H1-H6标题结构、链接统计(内链/外链/nofollow)、图片统计(有无ALT)、结构化数据类型和JS框架检测信号。帮助全面理解差异来源。
Cloaking是一种黑帽SEO手段,通过检测User-Agent或IP地址,向搜索引擎爬虫展示一套内容,向用户展示另一套内容。Google明确禁止Cloaking行为,违者会被手动惩罚或从索引中移除。
会。小幅差异是正常的:动态广告位、个性化推荐、A/B测试内容、时间戳等都会导致两次抓取的HTML不完全一致。关键是核心内容(Title、H1、正文文本、Meta标签)必须一致。
不一定。如果正确实现了SSR(服务端渲染)或SSG(静态站点生成),React/Vue/Next.js等框架的网站爬虫也能看到完整内容。本工具检测到JS框架信号时会特别标注,但有信号不等于有问题。
差异超过50%且绝对差值超过200字时标记为严重(大量内容可能依赖JS渲染)。差异在20%-50%之间标记为警告。差异小于20%通常是正常的动态内容差异。
部分能。工具通过不同UA抓取的HTML源码对比来推断差异。如果服务器对Googlebot返回了SSR版本而对用户返回了CSR版本,差异会被检测到。但如果两者都返回相同的CSR代码(都需要JS渲染),工具无法检测到渲染后的差异。对于后者建议使用Google Search Console的URL检查工具。
Googlebot是最重要的搜索引擎爬虫。很多网站会针对Googlebot做特殊处理(CDN缓存、预渲染、Bot检测等)。通过模拟Googlebot的UA可以检测这些特殊处理是否正确工作。
URL在当前页面PHP后端通过cURL即时抓取,不传输到第三方服务器。抓取到的HTML内容仅用于即时分析,处理后不存储任何数据。