内链外链分析器使用教程:一次扒清链接结构与SEO扣分项
本文目录
- 内链外链分析器到底解决了SEO的什么真问题?
- 这个工具背后的链接评分算法是怎么算的?
- 链接到底分几类?工具如何自动识别?
- rel属性的nofollow、sponsored、ugc该怎么用才不踩坑?
- 怎么用这个工具给一个页面做一次完整的链接体检?
- 相对链接和绝对链接,迁移站点时哪个会要命?
- 外链的域名分布和锚文本频率能看出什么门道?
- 内链外链分析器怎么和保哥的其他工具串起来用?
- 用工具做链接审计时最容易犯哪些错?
- 这个链接审计该多久做一次才合适?
- 常见问题解答
- 内链外链分析器和死链检测器有什么区别?
- 为什么我的页面内链显示很多,工具却说内链不足?
- 粘贴HTML和输入URL两种模式,结果会不一样吗?
- 内链被加了nofollow一定要改吗?
- 工具能分析JavaScript动态生成的链接吗?
- 外链应该全部加nofollow来“保住权重”吗?
- 权威参考资料
太长不看:内链外链分析器把一个页面里几十上百条链接的类型、锚文本、rel属性和书写方式一次性扒出来,再用一套从100分往下扣的规则告诉你这页的链接结构哪里漏了。内链不够扣分、锚文本空着扣分、内链被加nofollow扣分、图片链接没alt也扣分。保哥这篇把扣分公式、四种链接书写方式的迁移陷阱、以及怎么把它和锚文本分析器、日志分析器串成一条审计流水线讲透,顺手带一个跨境家居站产品页从57分修到89分的真实复盘。
做SEO久了你会发现,链接这件事最容易“看起来没问题,其实全是坑”。一个产品页表面排版干净,扒开源码一看:导航里3条内链被主题模板默认加了 nofollow,正文里5个“点击这里”当锚文本,页脚还有2个 href 是空的占位符。这些问题肉眼几乎看不出来,但搜索引擎每一条都记在账上。
保哥这套内链外链分析器,本质上就是把“人工逐条核对链接”这件又慢又容易漏的活儿自动化。你把页面URL丢进去,或者直接粘HTML源码,几秒钟它就把所有 <a> 标签解析出来,归类、统计、打分、列清单。这篇教程不只教你怎么点按钮,更重要的是把它背后那套链接评分逻辑掰开揉碎——你看懂了规则,才知道每一条建议到底在救你什么。
内链外链分析器到底解决了SEO的什么真问题?
先说清楚一件事:链接审计不是“高级玩法”,它是技术SEO里最基础、最高频的体力活。问题恰恰在于它太基础,基础到大家都默认“应该没事”,于是从来不查。
保哥见过太多这样的场景。一个跨境独立站换了新模板,上线三个月流量没起来,排查半天才发现新模板的“相关推荐”模块用的是 javascript:void(0) 触发的伪链接,搜索引擎根本抓不到这些内链,等于整站的内链网络断了一大截。还有的站做HTTPS迁移,正文里几十条路径相对链接在目录结构调整后全部指错,用户点进去一片404,而站长自己浏览首页时压根没踩到那几个页面。
这些问题的共同点是:单看一条链接没问题,要在几十上百条里发现“那几条出事的”,靠人眼翻源码效率极低。内链外链分析器干的就是这件事——它替你把每一条链接的身份证、属性、状态一次性列出来,再用一套规则帮你挑出真正该管的。具体来说它一次性回答这么几个问题:这页有几条内链,够不够?哪些链接没锚文本?哪些内链被错误地加了nofollow?相对链接和绝对链接各占多少、迁移时会不会出事?外链都指向哪些域名、有没有过度集中?
把这些问题用数据回答出来,你做决策就不再是“凭感觉觉得内链好像有点少”,而是“这页28条链接里只有4条真正的内链,其余全是导航和页脚的重复链接,正文内链严重不足”。这就是工具的价值:把模糊的直觉变成可核对的清单。
这个工具背后的链接评分算法是怎么算的?
很多人以为评分是个黑盒,其实保哥这套链接健康度评分简单得有点“朴素”:从100分起步,发现一类问题就扣一档分,扣到哪算哪,最低不低于0。它不搞复杂的加权矩阵,因为链接问题本身就是“有没有犯错”的是非题,扣分制最直观。
核心扣分规则可以分成两组看。第一组是结构性问题,分量最重。内链数量是大头:一条内链都没有直接扣25分,这是最严重的结构缺陷,意味着这页几乎是个孤岛;少于3条扣10分;3条以上不扣。空锚文本,也就是链接没有可见文字、又不是图片链接的那种,每个扣3分,最多扣到15分封顶。被加了nofollow的内链每个扣5分,最多扣15分——这是个隐蔽的大坑,后面专门讲。
第二组是规范性问题,单项分量轻些但常常成片出现。空链接(没有 href 或 href="")每个扣3分、上限10分。javascript: 伪链接每个扣3分、上限10分。用了HTTP而非HTTPS的混合内容链接每个扣2分、上限10分。图片链接缺 alt 每个扣3分、上限10分。你会注意到几乎每一类都设了扣分上限,这个设计不是随便定的,下一段就讲它为什么重要。
每一类都设了扣分上限,是为了避免“一个问题扣到负分”的失真——比如一页有50个空锚文本,也只扣15分,因为它要表达的是“这是个问题类别”,而不是“按个数无限惩罚”。这个设计很重要:它让分数始终反映“你犯了几类错”,而不是“某一类错被你犯了多少次”。
来一次手算演示,你就彻底懂了。假设保哥扒了一个跨境家居站的产品页,分析器给出这样一份体检单:
| 检测项 | 数量 | 扣分规则 | 实际扣分 |
|---|---|---|---|
| 内链总数 | 28条 | ≥3条不扣 | 0 |
| 空锚文本 | 5个 | 每个3分,上限15 | 15 |
| nofollow内链 | 2个 | 每个5分,上限15 | 10 |
| 空链接(无href) | 2个 | 每个3分,上限10 | 6 |
| javascript链接 | 1个 | 每个3分,上限10 | 3 |
| 图片链接缺alt | 3个 | 每个3分,上限10 | 9 |
把扣分加总:15+10+6+3+9=43分。100减43,这页的链接健康度得分就是 57分。一个57分意味着什么?意味着链接结构本身(内链够多)没崩,但细节问题扎堆——锚文本、nofollow、空链接、缺alt这几样全中了。后面那个真实复盘里,保哥就是从这个57分出发,把它一项项修到89分的。
看懂这套算法你会有个体会:分数不是目的,扣分项才是清单。工具给你57分没意义,给你“这43分扣在哪5个地方”才有意义。所以用这个工具时,永远先看扣分明细,再看总分。
链接到底分几类?工具如何自动识别?
分析器拿到HTML后,第一步是用正则把所有 <a> 标签连同它的属性和内部内容抠出来。然后对每条链接做两个维度的分类:一是“这是什么链接”,二是“这条链接是怎么写的”。这两个维度搞混的人特别多,得分清楚。
第一个维度是链接类型,按 href 的内容判断:指向同一域名(含www变体)的是内部链接;指向别的域名的是外部链接;# 或 #section 是页内锚点;javascript: 开头是脚本链接;mailto: 和 tel: 是邮件电话链接;没有 href 或为空的是空链接。判断内外链时有个细节:工具会把域名前的 www. 去掉再比对,所以 www.example.com 和 example.com 会被正确认成同一站,不会误判成外链。
第二个维度是 href 的书写方式,这才是迁移时的真正雷区,分四种:绝对链接(https://example.com/page,带完整协议和域名)、根相对链接(/blog/post,以斜杠开头,相对于域名根)、路径相对链接(page 或 ../other,不以斜杠开头,相对于当前页面所在目录)、协议相对链接(//cdn.example.com/file,省略http/https)。Google在它的 URL结构最佳实践文档里反复强调URL要保持一致、可预测,而书写方式混乱正是不一致的源头。
这两个维度合起来,工具才能给每条链接发一张完整的“身份证”:它是内链还是外链、用绝对还是相对写法、带不带rel属性、有没有锚文本、是不是重复出现。有了身份证,后面的统计和评分才有依据。这也是为什么粘贴HTML模式和输入URL模式会有差别——粘贴模式下没有基础域名,相对链接只能按原样展示而不解析,工具很贴心地不会把这种情况误判成错误。
rel属性的nofollow、sponsored、ugc该怎么用才不踩坑?
rel属性是链接审计里最容易“好心办坏事”的地方。保哥先把三个值的分工说清楚,再讲工具怎么帮你抓出误用。
nofollow 告诉搜索引擎“别把我的站和这个链接目标关联起来”;sponsored 标记付费、广告、赞助性质的链接;ugc 标记用户生成内容里的链接,比如评论区、论坛帖。Google在 出站链接限定官方文档里把规则讲得很明白:付费或交换得来的链接必须加 sponsored 或 nofollow,否则就违反垃圾链接政策。而且从2019年起,这三个值对Google来说已经是“提示”而非“硬指令”——意思是Google会参考但不保证完全照办。
真正的坑在内链上。很多CMS主题或安全插件会图省事,给某些内部链接默认批量加 nofollow,最常见的是登录、注册、购物车、后台这类页面,本意是“别让爬虫浪费预算去抓这些没价值的页”。但保哥见过不少主题把这个逻辑写过头,连正文里指向产品页、分类页的内链也一起加了 nofollow。结果就是你辛辛苦苦织的内链网络,权重传递在这几条上被自己掐断了。
分析器对这个场景有专门的检测:它会单独统计“被加了nofollow的内链”有几条,每条扣5分。为什么内链nofollow要重罚?因为出站外链加nofollow是常规操作,但内链通常不应该nofollow——你控制自己的站,没理由阻止权重在自己页面之间流动。看到这条扣分,第一反应应该是去翻模板代码或插件设置,而不是手动一条条改。
还有个安全相关的检测:外链用 target="_blank" 新窗口打开却没加 rel="noopener",工具会警告。这不是SEO问题而是安全问题——新打开的页面能通过 window.opener 反向操控你的原页面。现代浏览器虽然多数已默认隔离,但显式加上 noopener 仍是规范做法,工具帮你查漏。
怎么用这个工具给一个页面做一次完整的链接体检?
讲完原理,来走一遍完整流程。保哥把它拆成可复制的几步,照着做就能给任意页面出一份链接审计报告。
第一步,把页面喂进去。两种方式任选:输入URL让工具的服务端抓取整页HTML,相对链接会自动解析成完整地址;或者直接粘贴源码,适合那些反爬严格、抓取返回403的页面。保哥的习惯是先试URL抓取,被拦了再切粘贴模式——粘贴时记得把 <head> 里的内容也带上,否则 <base> 标签丢了会影响相对链接的解析基准。
第二步,先看扣分明细,别盯着总分。这是保哥反复强调的用法。结果区的“SEO洞察”会把每一类问题列成卡片,标着是错误、警告还是提示。你要做的是顺着这个清单往下捋,每一条都对应一个具体的修复动作。总分只是给你一个“整体好不好”的印象,真正干活靠明细。
第三步,用过滤器锁定问题链接。结果里可以按“有问题”“内链”“外链”“相对链接”筛选。比如你想集中处理迁移风险,就筛“路径相对链接”,工具会把所有不以斜杠开头的相对链接列出来,你一眼就知道哪些需要改成根相对或绝对写法。这一步把“全站几百条链接”收窄成“这十几条要动手”。
第四步,跑一次状态检测。工具能对去重后的URL(最多50个)并行发HTTP请求,实时显示状态码:绿色2xx正常、蓝色3xx重定向、红色4xx/5xx出错、0是连不上。死链直接修或删,重定向链则评估要不要改成直链——每多一跳都损失一点权重又拖慢加载。如果你想做更彻底的全站死链扫描,可以配合保哥的死链检测器一起用。
第五步,修完复检。按明细一项项改完,重新分析一次,看分数有没有回升、扣分项有没有清掉。链接审计不是一锤子买卖,它应该进你的发布检查清单,每次大改版后都跑一遍。
相对链接和绝对链接,迁移站点时哪个会要命?
这一节单独拎出来讲,因为它是保哥见过翻车最惨的链接问题,没有之一。先抛结论:站内链接优先用根相对(以斜杠开头),重要链接和所有外链用绝对,能不用路径相对就别用。
为什么路径相对链接危险?因为它的解析依赖“当前页面所在的目录”。同样一条 href="widget",写在 /products/index.html 里它指向 /products/widget,写在 /products/2024/index.html 里它就指向 /products/2024/widget。一旦你调整目录层级、改了URL结构、或者把内容搬到不同路径,所有路径相对链接的指向都会跟着漂移,而且漂得无声无息——服务器不报错,只是用户点进去到了不存在的页面。
保哥真碰过这么一个案例。一个做家居用品的跨境独立站,早期用静态站生成器搭的,正文里大量用 ../category/xxx 这种路径相对链接。后来他们把博客从 /blog/ 迁到根目录下,URL层级少了一层,结果正文里几百条 ../ 开头的链接全部指错,瞬间制造了一大批站内死链。更糟的是,因为首页和主要落地页用的是绝对链接没受影响,运营自己点点点根本发现不了,是两周后流量掉了一截、保哥用这个分析器逐页扫才定位到——筛选“路径相对链接”那一栏,一页就列出二三十条,问题一目了然。
修复方案很直接:把路径相对统一改成根相对(/category/xxx),这样无论页面搬到哪个目录,链接指向都不变。改完后那批404全部恢复,两周内排名爬了回来。这件事之后他们把“迁移前先跑链接分析器筛相对链接”写进了SOP。协议相对链接(// 开头)也建议一并改掉——现在全站HTTPS是标配,没必要再保留那种“跟随当前协议”的写法,工具检测到也会提示。
外链的域名分布和锚文本频率能看出什么门道?
很多人用链接分析器只看内链够不够,其实它对外链的两项统计——域名分布和锚文本频率——藏着不少策略信息,保哥每次都会专门翻一翻。
先说外链域名分布。工具会把页面里所有外链按目标域名归类,统计每个域名被链了几次,从高到低排出前30个。这张表能直接回答一个问题:你的出站链接是不是过度集中在某一两个域名上?正常的内容页,出站链接应该分散指向多个不同的权威来源;如果一页里十几条外链全指向同一个域名,要么是采集拼凑的内容,要么是有意无意的导流,这两种在Google眼里都不算自然。
反过来看竞品也一样——把对手的页面丢进去,看他们的外链都引了哪些权威站,往往能摸到他们的内容信源在哪。出站链接到底怎么做才不浪费权威,保哥在站外SEO体系拆解那篇里有更系统的讨论。
再说锚文本频率。工具会把所有链接的锚文本去重统计,列出用得最多的前40个,还分别标出每个锚文本用在内链和外链上各几次。这张表的用处是发现“锚文本过度集中”——如果某个关键词锚文本被反复用在大量内链上,可能被判定为过度优化。Google在它的链接最佳实践文档里明确说,好的锚文本应当“描述性、简洁、且与目标页面相关”,言下之意就是要自然多样,而不是同一个词反复堆。当然,锚文本分布的深度分析是另一个工具的专长,链接分析器这里给的是个快速概览,让你先有个数。
这两张表配合扣分明细看,你对一个页面的链接画像就基本完整了:结构(内链够不够)、规范(写法对不对)、外链(分散不分散)、锚文本(自然不自然)。一个有经验的SEO扫一眼这几项,心里就有谱了。
内链外链分析器怎么和保哥的其他工具串起来用?
单个工具解决单个问题,但链接审计是个系统工程,得几个工具配合才完整。保哥平时是这么串的。
链接结构搞定后,紧接着查锚文本自然度。内链外链分析器告诉你“锚文本有没有、空不空”,但它不评判锚文本的分布是否健康。这一步交给锚文本分析器——它会把锚文本分成品牌词、精确匹配、部分匹配、通用词、裸URL几类,算出比例,提醒你精确匹配是不是高到有Penguin风险。两个工具一前一后:先用链接分析器确保链接结构没硬伤,再用锚文本分析器确保锚文本画像自然。
然后用日志验证爬虫到底怎么抓。你以为内链都通了,但Googlebot实际有没有顺着这些链接爬?这就要看服务器日志了。日志分析器能告诉你爬虫真实抓了哪些URL、返回什么状态码、有没有在死链上浪费抓取预算。链接分析器是“理论上的链接结构”,日志分析器是“实际的抓取行为”,两者对照才知道理论有没有落地。
🔗 配套工具,一条审计流水线串起来:
内链外链分析器 — 本文主角,扒链接类型、rel属性、相对绝对写法并打分。
锚文本分析器 — 链接结构没问题后,查锚文本分布自然度与Penguin风险。
服务器日志分析工具 — 用真实爬虫日志验证内链有没有被实际抓取。
死链检测器 — 全站批量扫死链与重定向,配合链接分析器做更大范围排查。
这套组合拳的逻辑是“结构→画像→行为”三层递进。光看任何一层都是盲人摸象,三层对上了,你对一个页面的链接健康度才算心里有底。保哥布内链时还会回头参考自己写过的内部链接锚文本工程化那套方法,把工具数据和布链策略对起来用。
用工具做链接审计时最容易犯哪些错?
工具好用,但用错了反而误导决策。保哥总结几个高频误区,都是真金白银踩出来的。
第一个误区:只看总分,不看明细。前面强调过,再说一遍,因为太多人犯。一个85分的页面可能只是“小毛病没扣多少”,也可能是“内链充足但有2条nofollow内链正在悄悄掐权重”。分数掩盖问题,明细才暴露问题。永远先读扣分清单。
第二个误区:把导航和页脚的链接当成内链充足的证据。工具统计的内链数包含全站模板里的导航、页脚、侧边栏链接。一个页面显示“内链30条”很漂亮,但如果其中26条是每页都一样的导航链接,正文里真正相关的上下文内链可能只有4条。Google更看重正文里自然嵌入的上下文内链,模板链接的权重传递价值有限。所以看到内链数很多时,别急着高兴,去明细里看看有几条是正文内链。这一点上保哥很认同自己之前聊过的自动内链插件该不该用那篇里的观点:内链要的是相关性,不是数量。
第三个误区:忽略重复链接的锚文本问题。工具会标出“重复URL”——同一个目标在页面里出现多次。这本身不算错,但有个细节:当一个页面有多条链接指向同一URL时,Google通常只采纳第一条链接的锚文本。所以如果你的第一条是图片链接(没锚文本)、第二条才是描述性文字链接,那条好锚文本可能就白费了。看到重复链接,去确认第一条带的是不是最好的锚文本。
第四个误区:粘贴模式下误判相对链接为错误。粘贴HTML时没有基础域名,工具无法把相对链接解析成完整URL,但这不是错误,只是信息不全。有人看到一堆相对链接没解析就慌,其实那是正常的——要看相对链接解析后的真实指向,用URL抓取模式。
还有个容易被忽视的点:孤岛页面。如果某个重要页面在全站任何地方都没有内链指向它,它就成了爬虫和用户都难以抵达的孤岛。单页分析器看不出这个,得结合全站视角。保哥专门写过孤岛页面的定位与内链修复,可以配合着看。
这个链接审计该多久做一次才合适?
最后聊节奏。链接审计不是“做一次就一劳永逸”的事,但也不必天天跑。保哥给不同场景定了不同频率,供你参考。
日常维护:每月一次抽检核心页。选你最重要的那几个落地页、爆款产品页、流量大的文章页,每月用分析器跑一遍。重点看内链数有没有因为内容更新被意外删掉、有没有新增的死链。这是低成本的健康巡检,十分钟搞定。
触发式:任何大改动后立刻跑。换模板、改URL结构、迁移域名、批量改内容——这些动作之后必须跑链接审计,而且要重点筛相对链接和检测状态码。前面那个家居站的教训就是“改了目录但没复检”,等流量掉了才发现,代价是两周的排名波动。把“改动后跑链接分析器”写进发布清单,能挡掉绝大多数低级事故。
竞品研究:不定期。把竞争对手排名靠前的页面URL丢进工具,看他们的内链密度、锚文本怎么写、外链引用了哪些权威来源。这是逆向他们内容策略的一个低成本切口。你会发现一些排名好的页面,内链布得又密又准,外链引的全是行业权威源——这些都是可以学的。
保哥的总体建议是:把链接审计当成体检而不是急救。体检是定期的、便宜的、能早发现问题的;急救是出事后被动的、昂贵的、损失已经造成的。一个月花二十分钟跑几个核心页,比流量掉了之后熬夜排查划算太多。链接是SEO的骨架,骨架歪了上层建得再漂亮也站不稳。
常见问题解答
内链外链分析器和死链检测器有什么区别?
内链外链分析器专注于“单个页面内部的链接结构”——这页有几条内链外链、锚文本如何、rel属性对不对、相对绝对写法是否规范,并给出结构评分。死链检测器则偏向“批量验证大量URL的可达性”,扫的是状态码维度。链接分析器也内置了状态检测功能(每次最多50个去重URL),但要做全站范围的死链扫描,死链检测器更合适。两者配合:先用分析器看单页结构,再用死链检测器做大范围排查。
为什么我的页面内链显示很多,工具却说内链不足?
请去扣分明细里确认是哪种“不足”。如果是“内链少于3条”的扣分,说明工具识别到的内链确实少——可能你的“相关推荐”用了JavaScript伪链接没被算进内链。如果总数显示很多但你感觉正文内链少,那是因为统计包含了导航、页脚等模板链接。建议手动看明细,区分模板链接和正文上下文内链,后者才是Google更看重的。
粘贴HTML和输入URL两种模式,结果会不一样吗?
会,主要差在相对链接的处理上。输入URL时工具知道页面的完整地址,能把相对链接解析成绝对URL并判断内外链;粘贴HTML时没有基础域名,相对链接按原样展示、不解析,也不会被误判成错误。如果你要分析相对链接的真实指向、或做状态检测,用URL抓取模式更完整。被反爬拦截(403)时再退回粘贴模式。
内链被加了nofollow一定要改吗?
分情况。如果是登录、注册、购物车、后台这类对SEO无价值的功能页,加nofollow是合理的,目的是节省抓取预算。但如果是指向产品页、分类页、内容页的正文内链被加了nofollow,那几乎一定是模板或插件的误操作,应该去掉——你没理由阻止权重在自己站内流动。工具单独统计内链nofollow数量,就是为了帮你揪出后一种误用。
工具能分析JavaScript动态生成的链接吗?
取决于链接是怎么生成的。如果JavaScript最终往页面里插入的是标准的 <a href> 标签,且是在抓取时已经渲染好的,工具能识别。但如果链接是靠 onclick 事件、javascript: 伪协议或纯前端路由触发的,工具(和搜索引擎一样)抓不到——这恰恰是它要警告你的问题。对重度依赖前端渲染的站,建议结合服务端渲染或预渲染,确保链接以真实 <a href> 形式存在于初始HTML里。
外链应该全部加nofollow来“保住权重”吗?
不应该,这是个流传很广的误区。给所有出站链接无差别加nofollow,既不自然也没必要。合理的做法是按性质区分:付费、广告、赞助链接加 sponsored 或 nofollow;用户生成内容里的链接加 ugc;正常的、出于内容需要引用的权威外链,正常dofollow即可。适度的、指向高质量来源的出站链接反而是内容专业度的正向信号。一个外链全是nofollow的页面,画像上反而显得刻意。
权威参考资料
FAQPage + Article AI 引用友好版
很多页面排版干净,源码里却藏着被模板加了nofollow的内链、空着的href和指错的相对链接。这款工具几秒钟帮你把这些隐患逐条揪出来并打分。
- 技术SEO
- 链接审计
- 内链外链分析器
- SEO工具教程
- 页面SEO
title: 内链外链分析器使用教程:一次扒清链接结构与SEO扣分项 author: 张文保 (Paul Zhang) — PatPat SEO 经理 url: https://zhangwenbao.com/link-analyzer-internal-external-audit-guide.html published: 2026-02-08 modified: 2026-02-08 source-type: First-hand expert commentary language: zh-CN license: CC BY-NC-SA 4.0 (要求保留原文链接与作者归属)
本文标题:《内链外链分析器使用教程:一次扒清链接结构与SEO扣分项》
本文链接:https://zhangwenbao.com/link-analyzer-internal-external-audit-guide.html
版权声明:本文原创,转载请注明出处和链接。许可协议: CC BY-NC-SA 4.0