2023年谷歌SEO优化:网站结构优化怎么做?
网站结构优化是指通过调整和优化网站的首页、导航、布局等结构,提升网站的用户体验,有助于搜索引擎更好的理解和抓取网站的每个页面,也能更合理的分配网站内部页面的权重,从而提升网站在搜索结果中的排名的一个过程。
为什么要对网站结构进行优化?
网站结构优化既是要满足用户需求,也要方便搜索引擎的收录。通过合理的网站结构,可以帮助用户快速找到他们需要的网页,提升用户体验;同时也有助于Googlebot更方便的理解、爬取和收录网站的每一个网页,使网站可以迅速的提高排名并获得更多的流量。
以下是对网站结构进行优化的具体原因:
提升用户体验:
对网站结构和导航进行优化调整,以及及时出现的锚文本链接,都可以方便用户迅速的找到自己所需要的内容;
在网站上添加结构化数据,也丰富了用户的搜索体验。
加快收录排名
良好的网站结构有助于搜索引擎理解和爬取以及收录网页;
权重越高,排名就越高:把关键词布局到权重高的页面上,可以快速的获得排名;
站长地图可以引导Googlebot按照优先级和网站的层级结构进行有顺序的爬取,从而提高了网站的索引效率。合理分配页面的权重;
合理的分配和传递权重
网站上每一个层级都有自己的权重,首页权重最大,其次是二级分类页面,然后再是三级分类页面,通过网站结构优化把重要的网页放在权重较大的层级上,比如说首页或者是二级页面,这样就会给重要的网页分配到高一些的权重;
在网站内部合理的使用锚文本,可以改变网站内部的链接结构,增强网页之间的相关性和有效传递网页内部链接的权重。
01 网站首页
搜索引擎的蜘蛛或机器人(Googlebot)爬取网站是按照从按照网站的层级关系,从首页开始,一个层级到一个层级上,直到爬取完所有页面。所以如果要开始网站结构优化的话,第一个要优化的就是网站的首页。
确保首页上一定要有重要网页的链接,因为网站的首页是权重最高的页面,把重要网页的链接放在首页上就是告诉搜索引擎,这些页面也是重要的,同时首页也能把自身的权重传给这些重要页面上。
简单来说,谷歌大叔想给一些新上的文章加些权重,那么就在首页的添加了新上的文章的链接,这种做法就是告诉搜索引擎,这些页面比较重要。
如果你在你的网站上首页找不到重要页面的链接,那么就需要对首页的页面结构进行优化了。
首页设置合理的网页结构,而不只是在首页设置搜索框
设置合理的网页结构,可以方便搜索引擎理解、抓取和收录网站上的每个页面。
如果只在首页设置搜索框的话,没有合理的网页结构的话,这种操作相当于给Googlebot设置了爬行障碍,因为Googlebot没有办法在首页进行搜索框搜索,而只能是从首页设置的框架结构逐步爬取网页。
02 结构合理、层级分明的网站布局
为了满足搜索引擎爬取的要求,网站的结构应当具备以下特点:网站结构优化布局应该是结构合理、层次分明。
Googlebot在访问网站时会按照一定的顺序从一个网页跳转到另一个网页,一直遍历整个网站。为了确保顺利的爬行,网站的结构应当具备独立的主要类别,并且每个主要类别下面应有相应的子类别。这样,谷歌的爬虫才能按照有序的方式从一个类别转到下一个子类别进行爬取。
扁平化的网站布局有利于用户快速找到所需的内容,也不会让Googlebot迷路。下图是结构合理、层级分明的网站布局:
要确保在点击网站上的任何一个网页的时候,只要点击几下就可以了,所以网站结构化越扁平越好找网页,特别值得注意的是,这个网站的结构不宜过深,一般超过五个层级的框架就有点过深了,不利于用户和搜索引擎发现你的网页。
清晰合理、扁平化的网站结构的特点大概如下:
每个主类别(Main topic pages)都是独立的页面存在,具有清晰的主题和内容聚焦。这些主类别可以是导航菜单中的链接或主页上的主要部分。
每个主类别下应有相应的子类别(subtopic pages),形成层次结构。子类别应与主类别相关联,使得搜索引擎能够沿着主类别往下按顺序爬取子类别的页面。
通过建立清晰的主类别和子类别的结构,可以帮助搜索引擎的机器人更有效地浏览和理解网站的内容。这种有序的网站结构能够提升搜索引擎对网站的索引能力,有助于网站在搜索结果中获得更好的展示和排名。
举例:假如Googlebot要爬取谷歌大叔官网的某一篇博客的页面,这个爬取的层级路径是这样的:
首先,Googlebot先爬行到首页sdwebseo.com,
其次,Googlebot从首页爬行到博客页面https://www.sdwebseo.com/blog/
然后:从博客页面再爬行到谷歌SEO优化教程分类页面https://www.sdwebseo.com/google-seo-tutorial/。
最后一步:这一步Googlebot就逐步地最终爬取到了某一篇博客的页面。
另外很重要的一点是,网站上每一个层级都有自己的权重,首页权重最大,其次是二级分类页面,然后再是三级分类页面,通过网站结构优化把重要的网页放在权重较大的层级上,比如说首页或者是二级页面,这样就会给重要的网页分配到高一些的权重。
这样就要求在涉及网站布局的时候,考虑以下把重要的页面往一二级分类页面上布置。
03 关键词布局
我们承接上一个话题,在网站布局优化好了之后,来看一下页面权重(PageRank)等级和关键词的布局问题:
PageRank是谷歌的拉里佩奇用来计算页面重要性的权重值,一般页面的权重越高,排名就会越高:把关键词布局到权重高的页面上,有助于获得排名。
首页是权重最高的页面,我们就可以把网站的核心关键词布局到首页上,比如说你的核心关键词是glass bottle manufacturer,就可以把这个词布局到首页上。
其次的权重较高的页面是二级(main topic pages)栏目页面:例如产品分类页面、或者应用案例页面,还是拿glass bottles举例,你就可以把产品分类的关键词,例如带有容量的玻璃瓶关键词和带有用途这类关键词布局到二级页面上。
权重最小的页面是三级页面(subtopic pages),例如具体的产品页面(product pages)或者博客页面(posts),我们就可以利用这些页面来做搜索量小一些的具体产品关键词和话题关键词的排名了。
04 面包屑导航
面包屑导航一般在网站的顶部或者底部位置,可以让用户快速的返回上一层或者首页,
优化网站的导航,不仅方便Googlebot抓取到所有的网页,也可以使用户可以轻松的浏览和找到网站上的内容,提升网站的用户体验度和实用性。
导航建议使用面包屑导航,面包屑导航显示用户当前页面的位置和导航路径。这对于用户返回上一步和理解网站结构非常有帮助。
比如说一个用户是通过一个外链访问到你的网站上,这个用户到的不一定是首页,但是他能够通过导航栏判断自己所处的网页在哪个层级上。
05 简洁的文字网址
文字链接更容易被搜索引擎发现和收录,精简的文字链接不仅用户体验要好,也容易被搜索引擎发现。
在网址中使用字词也就是URL链接使用文字,为搜索引擎设置可抓取的文字链接,,比如说:
https://www.sdwebseo.com/google-seo-tutorial/
https://www.sdwebseo.com/google-adwords-tool/
https://www.sdwebseo.com/pagerank/
https://www.sdwebseo.com/google-search-operators/
这里要说一下文字链接要精简,不用使用太多的关键词,太长的网址会让用户望而却步。
使用文字链接的URL不仅跟网页相关度好,用户或者搜索引擎通过文字就能明白网页的大概内容是什么,有助于用户体验。
06 使用锚文本anchor text
Anchor text是指锚文本,也就是链接中可以点击的单词或者短语,它的作用是将文本和网页建立链接。锚文本提供了关于链接目标的描述文本,也是链接目标内容的提示文本,锚文本可以让用户和搜索引擎知道点击链接就到达什么样主题的页面。
锚文本可以优化网站的内部链接;在网站内部合理的使用锚文本,可以改变网站内部的链接结构,增强网页之间的相关性和有效传递网页内部链接的权重。
比如说,你想某款跑步鞋的网页在搜索引擎上的排名更高,就可以在首页给这个网页做一个锚文本链接:
因为首页是整个网站权重最高的网页,这样就可以把首页的页面权重有效的传递到这个锚文本链接的某款跑鞋的网页上,从而可以有效的提高这个页面的排名。
以下是使用锚文本的建议:
围绕主题,锚文本使用与页面内容有关的链接文本
尽量不要使用页面的URL做锚文本
锚文本简洁,一般使用几个词或者一个短语就可以了
网站内使用锚文本,可以帮助用户或者搜索引擎更轻松的浏览网站。
07 站长地图(sitemap)
站长地图(sitemap)是一种xml、RSS、mRSS 和 Atom 1.0或者文本文件形式的文件,我们可以用站长地图里面提高网站中的网页、视频或者其他文件的关于网站结构和链接的信息,站长地图还列出了网站上所有可供爬取的网页,还提供了网页更新时间、相对优先级等,搜索引擎会读取这个站长地图文件,从而更高效的抓取我们的网站。
使用站长地图可以优化搜索引擎的爬行路径,站长地图可以引导Googlebot按照优先级和网站的层级结构进行有顺序的爬取,从而提高了网站的索引效率。
如果你网站使用的wordpress、Wix或者Blogger这样的网站内容管理系统,就不用再向搜索引擎提供站长地图了,因为这些网站系统已经自带了站长地图功能,它们会为你自动提交站长地图。
08 网站链接URL
URL是网站的网址,一个好的URL不仅与网页内容有关,易被用户理解、也方便搜索引擎抓取和索引。以下是优化URL的一些因素:
URL里面包含关键词:好的URL结构要包含关键词而不是一堆乱码,这样要易被搜索引擎和用户理解。
比如说一篇博客的域名是:www.domain.com/what-is-google-seo/,从URL这个域名中我们就能明白内容是关于谷歌SEO的。
URL使用短域名:简洁的URL,不仅方便用户记忆,在谷歌搜索结果中可以完全展示,有助于提示网页的点击率。短的URL包含四到五个关键词就可以了,太长了用户也记不住。
使用HTTPS安全协议:安全性一直是网络的关键要求,谷歌就要求网页必须采用https协议才有资格在Google搜索中获得良好的网页体验状态,没有使用HTTPS安全协议的网站,在Google上很难获得一个好的排名。
查看你网站的HTTPS报告可以使用Google search console的HTTPS报告,这个报告可以让你了解你网站哪些是非HTTPS网页。
09 网站robots.txt文件
robots.txt文件禁止谷歌搜索引擎爬取的某些页面,起到限制搜索引擎bots抓取网站的作用。
当Googlebots到达一个网页后,它会先查看robots.txt文件有没有存在,如果网站上有robots.txt文件,而且那么搜索引擎就不会爬取禁止这些页面。
User-agent: *适用所有的蜘蛛爬虫,
Disallow: /指定搜索引擎不可以爬取的内容和文件,例子中Disallow: /wp-admin意思是搜索引擎不可以爬取网站后台的内容和文件,
Allow: / 搜索引擎可以爬取的内容和文件。
值得注意的是,虽然robots.txt文件禁止搜索引擎抓取某些页面,但这些URL还是会在在搜索结果中显示和被索引。如果你不想某些URL被编入索引或者从索引页面删除,建议使用noindex meta标签。
10 网站noindex标签
2019年谷歌在robots.txt文件中提到:使用noindex标签是移除索引页面最有效的方式。如果想从谷歌搜索页面移除已被索引网页的话,可在页面中添加noindex标签。
NOINDEX META标签:告诉搜索引擎不要索引本页面
NOINDEX META标签指令适用于所有的网页形式,例如HTML、非HTML页面、PDF、视频等。
11 网站indexifembedded标记
假如你是一家媒体内容发布者,如果你想让内容仅在嵌入到其他网页中时才被编入索引,不希望媒体内容页被编入索引,现在也有新做法了。
2022年1月,谷歌发布了新的漫游器标记indexifembedded,除了使用noindex外,再使用indexifembedded标记,这样就可以解决媒体内容发布者希望自己的内容在嵌入第三方网页时被索引、自己网站上的媒体内容不编入索引的问题了。
如果你想让内容仅在嵌入到其他网页中时才被编入索引,就要同时添加 indexifembedded 与 noindex 标记。例如:
<meta name=”googlebot” content=”noindex” />
<meta name=”googlebot” content=”indexifembedded” />
<meta name=”googlebot” content=”noindex,indexifembedded” />
或者在http标头中指定:
X-Robots-Tag: googlebot:noindex
X-Robots-Tag: googlebot:indexifembedded
…
OR
…
X-Robots-Tag: googlebot:noindex,indexifembedded
12 网站Canonical标签
Canonical标签是权威链接标记,又称为规范标签,是一项由Google、Yahoo和Microsoft等三大搜索引擎于2019年提出的建议措施。该标记的推出旨在减少重复内容,并且目前也得到了百度的支持。
权威链接标记只能用于同一域名下的网址,无法用于不同域名上的重复内容。使用权威链接标记的目的是向搜索引擎明确表示某个页面是权威页面,其他页面则是该页面的变体。这样做的好处是避免网站内出现重复内容,但缺点是搜索引擎将不会索引其他重复变体的URL。
如果你的网站是wordpress的话,你可以在网站后台可以按照这个步骤添加Canonical标签:
点击Plugins 》Add new 》搜索Yoast SEO》安装
13 结构化数据标记
谷歌一直推荐在网站上使用结构化数据,添加了结构化数据的网站可以丰富用户的搜索体验,还可以帮助搜索引擎理解网页的内容。
以下是添加结构化数据网站的常见用途:
突出品牌:
如果你想提高品牌知名度的话,可以利用徽标、本地企业和附加链接搜索框等功能。
突出产品:
你还可以选择产品结构化数据来突出产品,添加了产品结构化数据的网页会在相关搜索中显示产品的图片、价格和评价。
富媒体搜索结果的测试工具,使用这个工具可以测试你的结构化数据是否正确和是否适用于Google搜索结果:
https://developers.google.com/search/docs/appearance/structured-data
14 网站301重定向
301重定向是将一个网页从一个URL地址永久性的移动到另外一个URL地址。
网站要尽量避免频繁更改URL结构,如果实在要更改URL结构,要做301重定向的跳转,一来是可以把原来URL页面的权重传递到新的URL页面上来,二来是以避免产生404错误。
如果更换URL结构又不做301重定向,会对搜索引擎的索引和用户的书签产生负面影响。
这篇文章是谷歌大叔之前写过的如何做301重定向
https://www.sdwebseo.com/301-redirection/
15 网站404页面
HTTP404是一种代码,用来反映网页被删除、移动或者不存在的状况。当用户点击到网站上不存在或者已经被损坏的网页时,网站上就会出来404网页。
网站结构优化的一点是要优化404页面:
优化的404页面上跟网站有相同的风格、logo等,它提示用户访问的页面不存在;
另外,优化的404页面要引导用户返回到你网站上的其它网页。
具体做法是将404页面巧妙的设置上了各类目录、站点标识、搜索表单或者网站地图等。将错误页面的用户转化到了其他可访问的页面,也会增加其他页面的权重。
以下是维基百科的404页面,我们可以参考它的做法:
安装谷歌插件Check My Links可以检查网站上的404错误:
https://chrome.google.com/webstore/detail/check-my-links/ojkcdipcgfaekbeaelaapakgnjflfglf/support?hl=pt-BR
最后,建议大家根据以上15个点进行自检自查优化网站。SEO拼的就是细节和执行力。