对于第一次进行技术 SEO 审核的人来说,结果可能会让人感到压力山大。面对众多问题,常常会不知从何下手,也不清楚如何修复这些问题。不过别担心,本文将为你详细讲解如何一步步完成一次成功的技术 SEO 审核。
无论是为了优化自己的网站,还是为客户提供建议,了解技术 SEO 审核的基础知识都是至关重要的。那么,什么是技术 SEO 审核呢?
简单来说,技术 SEO 审核是对网站技术层面进行全面分析的过程。它的目的是检查网站是否针对各种搜索引擎(如 Google、Bing、百度等)进行了正确的优化。这包括确保不存在任何可能阻碍搜索引擎抓取和索引网站的问题。
通过审核,我们可以发现一些可能被忽视的技术问题,比如 hreflang 错误、规范标签问题或混合内容问题等。有时,一些看似微不足道的改变就能显著提升网站的排名。
一般来说,建议在以下情况下进行技术 SEO 审核:
养成定期审核的好习惯是非常重要的,这可以帮助及时发现和解决问题,保持网站的健康状态。
在开始技术审核之前,需要获取一些必要的访问权限。如果你要对不属于自己的网站进行技术审核,至少需要以下访问权限:
有了这些访问权限,就可以开始进行技术 SEO 审核了。接下来,让我们一步步来看如何完成这个过程。
首先,使用网站抓取工具对网站进行全面扫描。这个过程会检查网站有多少 URL,其中有多少是可索引的,有多少不可索引,以及有多少存在问题。
抓取完成后,工具会生成一份详细报告,列出所有发现的问题。这份报告非常有价值,可以帮助识别并修复那些影响网站性能的问题。
在运行第一次抓取之前,最好检查一下抓取设置。对于小型个人网站,默认设置可能就足够了。但对于较大的项目,可能需要调整一些设置,比如最大抓取页面数。
抓取完成后,我们会看到一个概览页面,给出网站健康状况的总体评分(通常是 100 分制)。这个分数可以作为网站整体健康状况的快速指标。
如果网站有无法被搜索引擎抓取的页面,那么这些页面可能无法被正确索引,甚至根本无法被索引。如果网站没有出现在索引中,用户就无法找到它。
在寻找可抓取性问题时,需要考虑以下几个方面:
优先级:高
确保页面被索引对于在 Google 上出现至关重要。
检查网站索引状况的最简单方法是前往 Google Search Console 并查看"覆盖"报告。在这里,可以准确地看到哪些页面被索引了,哪些页面有警告,以及哪些页面被排除在外及其原因。
优先级:高
robots.txt 文件可能是你网站上最直接的文件,但人们经常在这里犯错。虽然你可以通过这个文件建议搜索引擎如何抓取你的网站,但很容易出错。
大多数搜索引擎,尤其是 Google,喜欢遵守你在 robots.txt 文件中设置的规则。所以如果你不小心告诉搜索引擎不要抓取某些 URL 或甚至整个网站,那就是它们会做的。
这是一个告诉搜索引擎不要抓取任何页面的 robots.txt 文件示例:
User-agent: *
Disallow: /
优先级:高
Robots 元标签是一个 HTML 片段,告诉搜索引擎如何抓取或索引某个特定页面。它被放置在网页的<head>
部分,看起来像这样:
<meta name="robots" content="noindex" />
这个 noindex 是最常见的。顾名思义,它告诉搜索引擎不要索引该页面。我们还经常在整个网站的页面上看到以下 robots 元标签:
<meta
name="robots"
content="max-snippet:-1, max-image-preview:large, max-video-preview:-1"
/>
这告诉 Google 可以在其搜索结果页面上自由使用你的任何内容。
如果页面上没有 robots 元标签,搜索引擎会将其视为 index, follow,意味着它们可以索引该页面并抓取其上的所有链接。
noindex 实际上有很多用途:
但不恰当的使用也恰好是一个主要的可索引性问题。意外使用错误的属性可能会对你在搜索结果页面上的存在产生不利影响,所以记得谨慎使用。
优先级:高
XML 网站地图帮助 Google 导航你网站上所有重要的页面。考虑到爬虫无法停下来问路,网站地图确保 Google 在抓取和索引你的网站时有一套指令。
但就像爬虫可能会被 robots.txt 文件意外阻止一样,页面也可能被遗漏在网站地图之外,这意味着它们可能不会被优先抓取。
此外,通过在你的网站地图中包含不应该在那里的页面(如损坏的页面),你可能会混淆爬虫并影响你的抓取预算(稍后会详细介绍)。
主要的是要确保你想要索引的所有重要页面都在你的网站地图中,并避免包含任何其他内容。
优先级:高(对于大型网站)
抓取预算指的是搜索引擎可以抓取的页面数量和速度。
多种因素会影响抓取预算,包括网站上的资源数量,以及 Google 认为你的可索引页面有多重要。
拥有大量抓取预算并不能保证你会排在搜索结果的顶部。但是如果由于抓取预算问题导致你所有的关键页面都没有被抓取,那么这些页面可能就不会被索引。
如果你的页面很受欢迎,获得自然流量和链接,并在你的网站内部有良好的链接,那么它们可能会作为你每日抓取预算的一部分被扫描。
新页面以及那些没有内部或外部链接的页面(例如,在较新的网站上发现的页面)可能不会被经常抓取,甚至根本不会被抓取。
对于拥有数百万页面的大型网站或经常更新的网站,抓取预算可能是一个问题。一般来说,如果你有大量页面没有被抓取或没有按你希望的频率更新,你应该考虑如何加快抓取速度。
使用 Google Search Console 中的抓取统计报告可以让你了解你的网站是如何被抓取的,以及 Googlebot 可能标记的任何问题。
检查页面基本元素是很重要的。虽然许多 SEO 专家可能会告诉你,像元描述这样的页面问题并不是什么大事,但从 SEO 的角度来看,这是一种良好的维护习惯。
即使 Google 的 John Mueller 之前表示,在网页上有多个 H1 标签并不是问题。但让我们把 SEO 看作一个积分系统。
如果你和竞争对手的网站在搜索结果页面上并驾齐驱,那么即使是最基本的问题也可能成为决定谁排在顶部的催化剂。所以,即使是最基本的维护问题也应该得到解决。
让我们来看看以下几个方面:
优先级:中等
标题标签的价值远比大多数人给予的信任要大。它们的工作是让 Google 和网站访问者知道网页是关于什么的。
在原始 HTML 格式中,它看起来像这样:
<title>如何制作完美的SEO标题标签(我们的4步流程)</title>
近年来,标题标签在 SEO 界引发了很多争论。事实证明,如果 Google 不喜欢你的标题标签,它很可能会修改它。
Google 重写了大约三分之一的标题标签,其中一个最大的原因是它们太长了。
一般来说,确保所有页面都有标题标签,并且没有超过 60 个字符,这是一个很好的做法。
优先级:低
元描述是描述页面内容的 HTML 属性。它可能会作为标题标签下的片段显示在搜索结果中,以提供更多上下文。
吸引人的元描述会让更多访问者在搜索结果中点击你的网站。尽管 Google 只提供 37%的元描述,但确保你最重要的页面有很好的元描述仍然很重要。
但写元描述不仅仅是填补空白。它是关于吸引潜在的网站访问者。
优先级:高
规范标签(rel=“canonical”)指定重复或近似重复页面的主要版本。换句话说,如果你有大致相同的内容在多个 URL 下可用,你应该使用规范标签来指定哪个版本是主要版本并应该被索引。
规范标签是 SEO 的一个重要部分,主要是因为 Google 不喜欢重复内容。此外,错误使用规范标签(或根本不使用)可能会严重影响你的抓取预算。
如果蜘蛛在抓取重复页面上浪费时间,可能意味着有价值的页面被遗漏了。
优先级:高
尽管 hreflang 看似又一个简单的 HTML 标签,但它可能是最复杂的 SEO 元素之一。
hreflang 标签对于多语言网站来说是至关重要的。如果你有同一页面的多个版本,针对不同的语言或世界不同地区——例如,一个针对美国的英文版本和一个针对法国的法文版本——你就需要使用 hreflang 标签。
翻译网站是一项耗时且昂贵的工作,因为你需要付出努力并确保所有版本都能在相关的搜索结果中显示。但它确实通过迎合使用不同语言的用户,提供了更好的用户体验。
此外,由于多语言页面集群共享彼此的排名信号,正确使用 hreflang 标签可以直接影响排名因素。
优先级:高
结构化数据,通常被称为 schema 标记,在 SEO 中有许多有价值的用途。
最突出的是,结构化数据用于帮助获得丰富的搜索结果或知识面板中的功能。这里有一个很好的例子:在处理食谱时,每个结果会给出更多细节,如评分。
因为结构化数据帮助 Google 更好地理解不仅是你的网站,还包括详细信息如作者,所以结构化数据可以帮助语义搜索,并提高专业性、权威性和可信度(E-A-T)。
如今,JSON-LD 是结构化数据的首选格式,所以如果可能的话,请保持这种格式。但你也可能会遇到 Microdata 和 RDFa。
作为技术审核的一部分,你应该测试你的结构化数据。有很多工具可以帮助你完成这项工作,比如 Google 的结构化数据测试工具。
图片优化在 SEO 中经常被忽视。然而,图片优化有许多好处,包括:
以下是一些常见的图片问题:
优先级:高
损坏的图片无法在你的网站上显示。这不仅会导致糟糕的用户体验,还可能让网站看起来像垃圾邮件,给访问者留下网站维护不善和不专业的印象。
对于任何通过网站赚钱的人来说,这可能特别成问题,因为它可能使网站看起来不那么值得信赖。
优先级:高
网站上的大图片可能会严重影响你的网站速度和性能。理想情况下,你要以尽可能小的尺寸显示图片,并使用适当的格式,如 WebP。
最好的选择是在将图片上传到网站之前优化图片文件大小。像 TinyJPG 这样的工具可以在添加到网站之前优化你的图片。
如果你想优化现有的图片,有很多工具可用,特别是对于像 WordPress 这样流行的内容管理系统(CMS)。像 Imagify 或 WP-Optimize 这样的插件就是很好的例子。
优先级:中等
HTTPS 页面链接到 HTTP 图片会导致所谓的"混合内容问题"。这意味着页面通过 HTTPS 安全加载,但它链接到的资源,如图片或视频,是在不安全的 HTTP 连接上。
混合内容是一个安全问题。对于那些通过展示广告赚钱的网站来说,它甚至可能阻止广告提供商在你的网站上投放广告。它还会降低网站的用户体验。
默认情况下,某些浏览器会限制不安全的资源请求。如果你的页面依赖于这些易受攻击的资源,如果它们被禁止,可能无法正常运行。
优先级:低
Alt 文本,或替代文本,描述了网站上的图片。这是图片优化的一个非常重要的部分,因为它提高了网站对全世界数百万视力障碍者的可访问性。
通常,视力障碍者使用屏幕阅读器,将图片转换为音频。本质上,这是在向网站访问者描述图片。正确优化的 alt 文本允许屏幕阅读器准确地告诉有视觉障碍的网站用户他们"看到"了什么。
alt 文本还可以作为图片链接的锚文本,帮助你在 Google 图片中排名,并提高主题相关性。
当大多数人想到 SEO 的"链接"时,他们会想到反向链接。如何建立它们,应该有多少,等等。
许多人没有意识到内部链接的重要性。内部链接不仅可以帮助你的外部链接建设工作,还可以为搜索引擎和用户创造更好的网站体验。
使用内部链接正确地对主题进行分类可以为每个访问你网站的人创建一个易于理解的主题路线图。这有许多好处:
当然,当做得对时,这一切都是有意义的。但是当你第一次接触一个网站时,应该对内部链接进行审核,因为情况可能不像你希望的那样有序。
以下是一些常见的内部链接问题:
优先级:高
这里你可以看到所有网站的损坏内部页面。
这些问题很麻烦,因为它们浪费了"链接权重"并为用户提供了负面体验。
处理这些问题有几个选择:
优先级:高
这里突出显示了没有内部链接指向的页面。
可索引页面不应该被孤立有两个原因:
如果你的网站有多个孤立页面,按自然流量从高到低过滤列表。如果为仍在接收自然流量的孤立页面添加内部链接,它们肯定会获得更多流量。
外部链接是你页面中链接到另一个域的超链接。这意味着所有指向你网站的反向链接都是别人的外部链接。
外部链接通常用于以引用的形式支持来源。例如,如果我在写一篇博客文章,讨论一项研究的指标,我会外部链接到我找到该权威来源的地方。
链接到可信的来源会让你自己的网站对访问者和搜索引擎来说更可信。这是因为你表明你的信息是由可靠的研究支持的。
然而,就像其他任何东西一样,外部链接也可能造成问题。以下是一些常见的外部链接问题:
优先级:高(如果可索引)
这个问题可能指内部和外部链接,简单来说就是链接的 URL 返回 4XX 返回码。这些链接损害了访问者的用户体验,可能会损害你网站的可信度。
优先级:高(如果可索引)
同样,这个问题指的是内部和外部链接,本质上意味着一个页面根本没有链接。这意味着这个页面对你的网站访问者和搜索引擎来说是一个"死胡同"。
但就外部链接而言,如果你的页面没有外部链接,它会影响上面讨论的外部链接的所有好处。
自 2021 年 5 月以来,Google 一直使用称为核心网页指标(CWV)的速度指标来对页面进行排名。它们使用最大内容绘制(LCP)来评估视觉加载,累积布局偏移(CLS)来测试视觉稳定性,以及首次输入延迟(FID)来衡量交互性。
Google 的目标是改善用户体验,因为没有人喜欢慢速网站。
尽管只有轻微速度问题的网站可能不会从速度优化中看到任何排名改善,但研究表明,非常慢的网站可能会看到自然流量、点击率等方面的改善。
有许多优秀的速度测试工具可用,包括 Google 的 PageSpeed Insights 和 GTmetrix。
对于非常慢的网站来说,速度优化可能是一个复杂的过程。然而,对于使用 WordPress 的新手来说,建议使用一些可用的工具,如 NitroPack(付费的)来显著提高网站速度。
从技术角度来看,使用移动爬虫对你的网站进行第二次审核是一个好习惯。作为标准,大多数审核工具使用桌面爬虫来审核你的网站;然而,这可以在"项目设置"中的"爬取设置"下轻松更改。
技术 SEO 审核是一个复杂但必不可少的过程,能够帮助我们发现网站的潜在问题,并通过优化来提升网站的性能和排名。同时技术 SEO 也是一个持续的过程,通过定期审查和修复,确保网站在技术层面始终处于最佳状态,为用户和搜索引擎提供良好的体验。