揭秘Google排名的205个因素(百度80%管用)--上
不少人都知道Google的搜索排名算法使用200多个因素,但具体是什么呢?
除了Google的核心算法工程师,几乎没有人知道完整真相。
而所谓的SEO技术,很多时候是分析、测试搜索获得的简单结论,有些优化方向是明确的,比如良好的用户体验、优质内容带来的用户行为变化对SEO的影响;而有些优化方向只能靠猜测。
由于搜索流量的巨大价值,很多网站不惜挺而走险,利用算法漏洞去作弊,以期获得更多的流量。
俗话说:“道高一尺魔高一丈”,黑帽SEO与搜索引擎之间的不断博弈,让搜索算法也不断迭代更新。
除了博弈带来的算法变化,新媒体和技术的诞生也让搜索引擎的算法不断进化,比如Twitter、Facebook等社交媒体对搜索的影响。
比如这几年Google发布了熊猫算法、企鹅算法的各个版本,百度也发布了石榴、绿萝、冰桶等算法。
每个大的搜索算法迭代都有核心目的和互联网环境变化的影响。
都说“读史可以鉴今”,那我们一起研究下Google使用过的排名因素(很多现在依然有效),希望能窥探今后搜索引擎演化的端倪。
以下一共有205条排名因素,有些已被证实,有些有争议,有些依然只是猜测。
以下内容翻译自:Google’s 200 Ranking Factors: The Complete List
一、域名因素
1、域名年龄
谷歌知名工程师Matt Cutts曾在这个Youtube视频中说过:“注册6个月与注册一年的域名差别不那么大”。
换句话说:Google确实使用域名年龄作为一种因素考虑,但权重不高。
2、顶级域名中出现关键词
不像过去有助于提升排名,但域名中的关键词仍然作为相关性的一种信号。
3、域名开头包含目标关键词
在域名开头包含目标关键词,相对于不含关键词或尾部包含关键词的域名有优势。
4、域名到期时间
Google于2015年3月31日申请了“基于历史数据的信息检索”的专利,某世界知名SEO讨论也讨论过其中的细节,暗示Google确实研究域名注册和更新日期。
(1) 域名注册日期可以作为网站成立日期的参考
(2) 域名的一些信息有助于区分合法和非法网站,有价值的网站(合法)
一般会多支付几年的域名费用,而违法、灰色行业则很少使用超过一年。所以打算好好做网站的朋友多续费几年域名吧。
5、子域名使用关键词
Moz网站2011年的报告指出,子域名中出现关键词可以提升排名。
比如我们网站的机械行业子域名就用了“机械”的拼音,看来这种做法有一定好处。
jixie.huangye88.com/
6、域名历史
如果域名所有权几经更迭,那Google可能会重置网站的历史记录,以前域名的反向链接价值会被丢掉。
7、完全匹配域名
如果域名和关键词完全一致,如果网站质量很高,这依然是优势。否则反而更容易被识别惩罚。
8、公开与隐藏Whois信息
Matt Cutts在2006年的Pubcon会议中说到:“当检查网站的Whois时,发现不少都有隐私保护服务,这很不寻常。…打开Whois隐私保护并不是默认的(不少是收费服务),如果把这些因素放到一起考虑,你的网站会被归到某个类别对待(打开隐私保护的站),而不独立了(可能被牵连)”
9、惩罚网站所有者
如果某人被识别为垃圾邮件发送者,那Google会仔细检查该人拥有的网站是否有意义。
10、国家专属域名
使用国际/地区专属顶级域名(.cn、.ca等)可以提升在这些国家和地区的排名,但限制了网站在全球获得排名的能力。
二、页面因素
11、标题中包含关键词
标题是第二重要的页面因素(除页面内容之外),在页面SEO优化中作用巨大。
根据Moz.com的数据,标题开头使用关键词比结尾使用效果要好,如下图所示:
还有Meta description中出现关键词也是高相关性的信号,现在不是特别重要,但依然有些用。
12、H1标签中出现关键词
H1标签是”第二个标题标签“,也非常重要。
根据一些相关性研究表明:
分值越低,说明排名越靠前。从测试结果看,H1标签作用比P标签对排名的影响大。
13、页面中出现关键词
页面中有关键词比其他任何相关性都更有说服力。
14、内容长度
文章长一般会包含更多关键词,涵盖的内容也会更广泛,与短小精悍的文章比有优势。
SERPIQ网站发现内容长度于搜索结果排名相关。
测试结果:平均长度为2500个单词的文章排名效果最好,不知道有没有人针对百度测试过中文页面篇幅对搜索结果的影响。
15、关键词密度
虽然不像以前那么重要,但依然会被Google用来确定网页主题。但关键词密度过大会有反作用。
16、内容中的潜在语义索引关键词(LSI)
潜在语义索引关键词(Latent Semantic Indexing = LSI)帮助搜索引擎从多义词中提取具体意义(比如 Apple 识别为苹果公司还是苹果这个水果),所以页面中出现的其他相关词很重要。是否存在LSI词可能作为内容质量的评判标准。
17、Title和Meta Description中的潜在索引关键词
与网页内容一样,Meta标签中的潜在索引关键词(LSI)有助于Google辨别同义词,也可以作为页面相关性信号。
18、页面加载速度
无论Google还是Bing都使用页面加载速度作为一个排名因素。搜索引擎蜘蛛会根据页面代码和文件大小估算网站速度。
19、重复内容
同一网站上的相同内容(可能稍作修改)可能会对不少人都知道Google的搜索排名算法使用200多个因素,但具体是什么呢?
除了Google的核心算法工程师,几乎没有人知道完整真相。
而所谓的SEO技术,很多时候是分析、测试搜索获得的简单结论,有些优化方向是明确的,比如良好的用户体验、优质内容带来的用户行为变化对SEO的影响;而有些优化方向只能靠猜测。
由于搜索流量的巨大价值,很多网站不惜挺而走险,利用算法漏洞去作弊,以期获得更多的流量。
俗话说:“道高一尺魔高一丈”,黑帽SEO与搜索引擎之间的不断博弈,让搜索算法也不断迭代更新。
除了博弈带来的算法变化,新媒体和技术的诞生也让搜索引擎的算法不断进化,比如Twitter、Facebook等社交媒体对搜索的影响。
比如这几年Google发布了熊猫算法、企鹅算法的各个版本,百度也发布了石榴、绿萝、冰桶等算法。
每个大的搜索算法迭代都有核心目的和互联网环境变化的影响。
都说“读史可以鉴今”,那我们一起研究下Google使用过的排名因素(很多现在依然有效),希望能窥探今后搜索引擎演化的端倪。
以下一共有205条排名因素,有些已被证实,有些有争议,有些依然只是猜测。网站搜索引擎的收录和排名有负面影响。
20、rel=“canonical”标记
合理使用rel="canonical"标记,会防止Google误判网站内容重复而惩罚。
21、Chrome浏览器访问速度
Google可能会使用Chrome的用户数据来识别与HTML代码无关的页面加载速度情况。
22、图像优化
图片的文件名、Alt文本、Title、Description和Caption都是重要的页面相关性指标。
23、内容更新速度
Google Caffeine算法对时间敏感的搜索很重视,表现就是搜索结果会显示内容更新时间。
24、内容更新幅度
编辑和更新也是一个页面新鲜度因素。添加或删除整个段落才算重要更新,不能只是调换一些词的顺序。
25、页面历史更新频次
关键词出现在页面前100个字中似乎是一个重要的相关信号。
26、关键词突出显示
页面多久更新?每天、每周、每隔5年?页面更新频率在提升页面新鲜度中起到重要作用。
27、H2/H3标签中出现关键词
将关键词显示在H2或H3标签的副标题中是另一个弱相关信号。
28、关键字匹配
关键词全字匹配更重要,比如搜索“cat shaving techniques(给猫剃毛技术)”,针对完全匹配做的优化页面就比“techniques for shaving a cat”要好,虽然意思一样。
29、出站链接质量
许多SEO认为链接指向权重网站有助于向Google发送信任信号。
30、出站链接主题
根据Moz的试验,搜索引擎可以使用你链接指向的页面作为相关性信号。例如:你有一个汽车相关的页面链接指向了一个电影相关的页面,这可能会告诉Google你的页面是关于汽车电影的,而不只是单指“汽车”。
31、语法和拼写
正确的语法和拼写是一个页面质量信号。
32、复制内容
页面上的内容是否是原创?如果是从Google索引页面中采集或复制的,它不会获得和原始内容一样的排名。
33、有用的补充内容
根据Google公布的评分指南文件,有用的补充内容是网页质量的指标(也是排名指标),比如货币换算器、贷款利息计算器等。
34、出站链接数
过多的Dofollow出站链接会导致PageRank“泄露”,这会影响到页面的排名。(Google已经取消很久了,但这条规则应该还适用的)
35、多媒体
图像,视频和其他多媒体元素可以作为内容质量信号。
36、指向页面的内部链接的数量
网站内链数量表明它相对于其他页面的重要性,越多越重要。
37、指向页面的内部链接的质量
网站里高权重(PR)页面的内链效果比低权重(或无权重)的效果好很多。
38、死链数量
页面太多死链是网站被遗弃或没人维护的特征,Google会使用死链来评估网站首页质量。
39、内容可阅读等级
Google会评估网页的阅读难度。但这条规则有争议,有人认为容易阅读的浅显内容有助于吸引读者,还能提升排名,而有些人则认为容易被认为是内容工厂。
40、联盟链接
联盟链接(Affiliate Link)本身可能不会影响排名。但如果太多的话,Google的算法可能会更加注意你网站的其他质量信号,以确保网站不是一个单薄的联盟链接网站。
41、HTML错误和W3C验证
网站页面很多HTML错误可能是质量差的特征。虽然这点有争议,但很多SEOer认为,网页不能通过W3C验证是一种网站质量差的信号。
42、网页所在域名权重
如果其他一切条件相同,权重高的域名页面排名更好。
43、页面PageRank
虽然并不完全相关,但是一般来说,页面有更高的PR值,排名会比PR值低的好。(Google现在已经没有PR值了)
44、网址长度
URL过长可能会影响搜索排名。
45、URL路径
目录层级越浅,越靠近根域名,可以增加URL权重。
46、人工干预编辑
虽然未得到证实,但Google提交过一项允许人工编辑影响搜索引擎结果页(SERP)的系统专利。
47、页面类别
页面出现在什么类别是一个相关信号,如果页面和类别不相关,则很难获得好的排名。(信息要发布到正确的分类)
48、WordPress标签
标签是WordPress特定的相关信号。改善搜索引擎优化效果的唯一方法是将一个内容与另一个内容相关联,更具体地说是将一组内容相互关联。
49、URL中的关键字
URL中出现的关键词是一个重要的相关信号。
50、URL字符串
Google会自动识别URL字符串中的目录和分类,可以识别出页面主题。
51、参考资料和来源
引用参考资料和来源,如学术论文,可能是高质量内容的标志。Google质量指南规定,引用页面时应注意来源:“是否是专业知识或权威来源,这很很重要”。不过,Google否认他们使用外部链接作为排名因素。
52、无序和和有序列表
无序和和有序列表有助于为读者分解内容,用户体验会更好。Google可能更喜欢使用列表的内容。
53、Sitemap中页面优先级
Sitemap.xml文件中指定的页面优先级可能会影响排名。
54、太多出站链接
有些网页有太多导出链接,会干扰和分散主要内容。
55、其他关键字的排名页面数量
如果页面获得了其他关键字的排名,那么这个词的排名权重可能会提升。
56、页面年龄
虽然Google喜欢新鲜的内容,但是定期更新的旧页面可能会超过新页面。
57、用户友好的布局
这里再次引用Google质量指南文件:“高质量的页面布局会让页面主体部分很容易被用户看到”。
58、停靠域名
2011年12月的Google更新降低了停靠域名的搜索可见性。
59、有用的内容
正如Backlinko读者Jared Carrizales所指出,Google可能会区分“高质量”和“有用的”内容的不同。
三、网站级因素
60、内容可以提供价值和独特的见解
61、联系我们页面
Google质量文件指出,他们更喜欢具有“适当联系信息”的网站。如果网站的联系信息和whois信息一致,可能会有奖励。
62、域名信任度
域名获得多少来自种子站点(搜索引擎极度青睐的抓取起始站点)的链接是一个非常重要的排名因素。
63、网站架构
一个很好的整合网站架构(尤其是一个仓筒结构)可以帮助Google识别和抓取、组织你的内容。
仓筒结构的理解就是把同一类内容放到不同的目录下,就像农民会把小麦、大麦、燕麦放到独立的仓库,如果混在一起,只能称之为”谷物“,反而降低了价值。结构要点:将同类型和主题的页面放在一起;分离不相关的页面;加强每个目录的着陆页。
64、网站更新
网站的更新频次,尤其是添加新内容时。这是一个很好的提升网站新鲜度的信号。
65、页数
网站页面数对权重略有影响。至少一个拥有很多内容的大型网站比内容薄弱的赚联盟费网站要强。
66、站点地图
站点地图有助于搜索引擎更轻松、更彻底地抓取和索引你的页面,提高页面可见性(搜索排名)。
67、网站正常运行时间
网站经常维护或宕机可能会影响排名(如果没有及时修复,甚至可能导致减少索引量)
68、服务器位置
服务器位置可能会影响网站在不同地区的排名,对于地域相关的搜索特别重要。
69、SSL证书
已经确认Google会索引SSL证书,并使用HTTPS作为排名信号。
70、服务条款和隐私页面
这两个页面有助于告诉Google你的网站是值得信赖的。
71、重复的Meta标签内容
网站页面使用重复一样的Meta keywords和Description可能会降低你的所有页面可见性。
72、面包屑导航(Breadcrumb)
拥有面包屑导航是用户体验良好的网站结构风格,可以帮助用户(和搜索引擎)知道他们在网站上的位置。
SearchEngineJournal.com和ethicalseoconsulting.com都声称面包屑是一个重要排名因素。
73、移动版优化
谷歌的官方建议是创建一个响应式网站。响应式网站可能会在移动搜索中获得优势。Google还会对移动搜索结果中没有移动版的页面进行降权。
74、YouTube优化
可能因为Youtube是Google旗下产品,搜索结果页面(SERP)中有特殊排名待遇(排名很好),尤其是Google 熊猫算法后,Youtube流量增加显著。
75、网站可用性
难用的网站一般用户停留时间短、访问深度浅、跳出率高,这些都会降低排名。这可能是从大量用户数据中收集到的独立算法因素。
76、Google Analytics(分析)和Google网站管理员工具
有些人认为,在网站上安装这两个程序可以改善网页索引。也可能直接影响排名(因为Google可以获得网站更准确的跳出率,是否从反向链接获得流量等)。
国内则对应的是百度统计和百度站长工具。
77、用户评价/网站声誉
Yelp和RipOffReport.com可能在Google这个算法中发挥了重要作用。Google甚至发布了他们抓住了一个利用用户差评获得反向链接的案例。
国内应对对应的就是百度口碑网站了:百度口碑
四、反向链接因素
78、链接的域名年龄
老域名的反向链接可能比新域名作用更大。
79、链接的域名数量
引用域名数量是Google算法中最重要的排名因素之一,如下图所示(Moz数据,横坐标是排名),链接域名数量越多排名越高。(请注意:图中也告诉我们链接数是有阈值的,在没有突破阈值前,有可能链接域名越多,排名反而会下降)
80、独立C类IP的链接数
来自不同C类IP(Class-C)数量越多,说明链接广泛性越好。
81、链接页数
链接页面的总数很重要,即使部分都来自同一个域名,这也对排名有帮助。
82、Alt标签(用于图像链接)
Alt文本可以说是图像的”锚文本“。
83、来自.edu或.gov类域名链接
虽然Google的Matt Cutts说不会做区别对待。但是,这并不妨碍广大SEOer认为Google对.gov和.edu域名的权重算法中有特殊的地方,也就说大家认为来自教育机构和政府网站的链接价值更大。
84、链接页面的权重
反向链接的页面权重(PageRank)是非常重要的排名因素。
85、链接域名的权重
同等页面权重下,域名权重越高越好(PR3站点的PR2页面权重小于PR8网站的PR2页面)。
86、来自竞争对手的链接
如果你能获得关键词搜索结果中其他网站的反向链接,则对于关键词排名特别有价值。
87、社会化网站引用页面
被社会化(设计)网站引用可能会影响链接的价值,被引用的越多越好。
88、来自垃圾网站的链接
来自垃圾网站的链接可能会伤害网站排名。
89、用户帖子引用
虽然让用户发布引用链接是白帽SEO的一部分,但如果链接来自签名或简介部分,价值可能不如页面内容里的相关链接,尽量能让用户帖子内容里加链接。
90、来自网站首页的链接
来自网站首页的链接权重比内页的要高很多。
91、Nofollow链接
SEO中最有争议的话题之一。Google的官方话是:“一般来说,我们不跟随他们。”
这表明他们至少在某些特定情况下会Follow,拥有一定百分比的nofollow链接可用于区分自然与非自然的链接。
92、链接类型的多样性
如果链接都来自某单一来源,比如论坛个人资料和博客评论页面,这明显不自然,会容易识别为垃圾链接。而来自不同来源的链接则是自然链接的标志。
93、赞助链接
像“合作伙伴”、“赞助商链接”这样的词语可能会降低其附近链接的价值。
94、内容相关链接
页面内容中的链接权(语境链接)重比空白页面(不一定空,比如单独的友情链接页)或其他非价值页面的链接权重更高。
一个“语境链接”的好例子:guestographics的反向链接。
95、过多301重定向页面
根据Google网站管理员帮助视频,过多301重定向链接会稀释部分(甚至全部)PR 。
96、反向链接锚文本
如Google原始算法中说:“首先,锚文本通常能提供比页面本身更准确的网页描述。”
锚文本的重要性虽然降低了(可能被Spam利用),但它仍然发送强烈的相关信号。
97、内部链接锚文本
内部链接锚文本是另一个相关性的信号,虽然可能与反向链接的锚文本权重不同。
98、链接标题
链接标题(当悬停在链接上时出现的文本)也用作弱相关信号。
99、引荐域的国家/地区
从国家/地区的顶级域名(.de,.cn,.co.uk)获取链接可能会帮助网站在该国家排名更好。
100、内容中的链接位置
在内容开头的链接比内容结尾的链接权重高。
101、页面中的链接位置
通常,在页面主体内容中添加的链接比页面底部或侧边栏中的链接权重更高。
102、链接域相关性
来自类似主题的利基站点(垂直网站)链接比来自完全不相关网站的链接更强大。有效的SEO策略依然着重于获得相关链接。
103、页面级相关性
Hilltop算法指出,与页面内容紧密相关的链接权重比不相关页面链接权重更高。
104、链接周围文字代表的情绪
Google可能已经可以根据链接周围文本识别出情绪,分析出链接是推荐还是负面批评引用。
105、标题中的关键词
Google对页面标题中包含对应关键字的链接给予更多权重(“专家链接到专家”,类似于专家间的互相推荐,可信度更高)。
106、正链接速度
链接增加速度(反向链接增加速度快于减少速度)的网站通常会得到搜索结果排名提升。
107、负链接速度
链接减少速度(反向链接减少速度快于增加速度))可以显著降低排名,因为它是流行度下降的信号。
108、专业主题链接
Aaron Wall声称,从专业的相关主题页面获取的的链接会给予更高的权重。
109、权威网站链接
从公认的行业权威网站获得的链接比小的专题网站获得好处多。
110、维基百科的引用链接
虽然添加有nofollow标签,但很多人认为,从维基百科获取链接可以让你的网站在搜索引擎眼中增添一点信任和权威。
国内可以增加一些来自百度百科和互动百科的引用。
111、链接附近相关文本
在反向链接周围出现的文本有助于告诉Google你的页面主题。
112、反向链接添加时间
根据Google专利,以前添加的链接比新加的反向链接具有更多的权重。
113、真实网站链接与垃圾博客链接
Google给“真实网站”的链接权重比垃圾博客链接高。Google可能会使用品牌和用户互动信号来区分两者。
114、自然链接
拥有“自然链接”的网站将排名高,而且排名更稳定持久。
115、互惠链接
Google指出“过度链接交换”是一种作弊,需要避免。
116、用户生成的内容链接
Google能够识别用户生成(UGC)的链接与实际的网站所有者添加的链接。
例如:Google知道来自Wordpress官方博客上的链接与用户创建的wordpress博客joesblog.wordpress.com链接是非常不同的。
117、来自301跳转的链接
经过301重定向的链接与直接链接相比可能会损失一点点权重,然而Google的Matt Cutts说:301链接类似于直接链接。
118、Schema.org微格式
支持Schema微格式的页面可以在Google的搜索结果中出现,从而直接提升搜索结果页的点击率这是不争的事实。
119、DMOZ收录
许多人认为,Google会给被DMOZ.com收录的网站更多的信任和权重。
120、链接网站的可信度(TrustRank)
网站的可信度也可以传递,如果很多可信度高的网站指向到你网站,对排名有好处。
121、页面的出站链接数量
页面的PageRank是有限的,导出链接多的页面比导出少的效果差。
122、来自论坛的链接
由于大量作弊,Google可能会大大降低论坛中链接的权重。
123、链接页面的字数
1000字帖子中的链接比25个字帖中的链接更有价值。
124、链接页面的内容质量
拼写错误多,语句不通内容里的链接价值不如专业包含多媒体内容里的链接。
125、全站链接
Matt Cutts已经确认,全站链接被“压缩”识别为单个链接。