深度挖掘亚马逊Indexing机制
上一篇吐槽文章收到了老铁们的暖心留言,这几天心里一直暖暖的。连倒春寒带来的大降温也显得不那么寒冷了。
我本是一个性情中人,还有一点点的玻璃心,一点点的伤春悲秋之感怀,遇到一些不顺心的事情,难免会往悲观的角度想。以前总是自诩有一个柔软的心脏,却总是被友人调侃为性格缺陷。
好在各位老铁的暖心安慰,让我有了坚持下去的动力。毕竟正在坚持的,是一件大事儿,路上难免坎坷,有你们一起同行,我也就不再孤单了。
言归正传,今天想和大家深挖一个话题,关于Amazon Indexing,也就是亚马逊的收录机制深挖。简单来说,收录机制有一个我们更熟悉的词汇叫做搜索引擎蜘蛛爬取。
任何一个搜索引擎在对每一个listing或者网站做ranking排名之前,必须要完成对他的收录和爬取。通俗一点来说,就是你得让亚马逊A9知道你是什么,你属于哪一类。试想一下,如果你卖的是苹果,亚马逊并不知道你卖的是苹果,那么A9在针对Apple这个词做ranking的时候,你是不可能被展现的,因为你连花名册都没有进入。
最近很多老铁都遇到一种情况,就是listing前台搜不到,类目也没有了,但是后台完好如初。找人查原因结果都是:manually removed from search index。也就是说亚马逊蜘蛛把你拉黑了,并没有去收录你。那么结果就是前台即使搜ASIN,搜索你的品牌名加标题也没有你的展现。
所以说,Indexing没做好压根都不要去谈什么排名,排第几页这种话题,做好Indexing 是SEO的第一步,也是最重要的一步。
就Amazon Indexing本身来说,具体一点,就是做好Title, Bullet points, Product description 和 backend search term这几个关键部位的关键词布局。
这一块基础部分想必很多老铁耳朵都听出茧子了,不知道的新人也可以去后台搜一下,都有详细写每一个部分怎么写会比较SEO-Friendly。
当然也可以温习一下我年前写的文章:亚马逊A9算法解析之Indexing
不过,今天既然是深挖,所以简单浅显的基础内容我们就不聊了,直接聊一聊最近我们团队针对这一块,经过大量测试和试验后的一些结果和反馈。前菜略过,直接上Main Course。
测试结果一
Bullets hold more “weight” than back end search terms and description
为了更直观的表现结果,这里我拿出之前做过大量测试的case里面,其中一个比较典型的case来说。首先当你搜索关键词“exercise bands” 的时候,你通过爬虫能够发现,排名前三页的产品,几乎95%以上在他们的bullet points里面,都有“exercise”or“band”这两个词出现,如果在bullet points里面没出现"exercise" or "band"的listing,一般排名相对会偏后,出现过的产品整体会靠前。
再看一个类似的例子,当我们搜索“teak table”的时候,几乎前两页的产品在他们的五点描述里面都或多或少会出现“teak”or“table”,那些没有在五点描述里面体现“teak”or“table”的listing,相对来说,都会明显地靠后偏后。
但与此同时,我们针对于亚马逊站内listing的description和backend search term (别人listing后台关键词是通过VC看的) 做一个类似的测试,却没有发现以上这么明显的趋势,结果是比较混乱的,而不是像做bullet points测试那样,在排名上面呈规律化的趋势。
所以,我们经过海量测试,得出来的结论是:亚马逊listing五点描述这一块的权重,是远远大于产品描述以及后台关键词的,占据仅次于标题的一个重要位置。
测试结果二
Definition of Amazon Stemming
亚马逊在后台TOS里面,有明确的写到:our algorithm accounts for stemming。什么是stemming呢?简单来说,就是针对一个search term,它的复数形式、过去式以及拼错形态。那么亚马逊声称A9能够account for stemming这句话怎么理解呢?
简单来说就是,如果water bottle在你的listing里面,而且被收录了。当消费者搜索:water bottles(复数形式)或者water boltle (bottle拼错了) 的时候,即使你的listing里面没有这两个词,亚马逊搜索引擎依然能够搜索得到。这也是亚马逊官方TOS里面所说的,经过我们的测试,发现结果也是这样。
不过我们的同事也发现了一个很奇怪的现象,就拿water bottle举例,water bottle在前台的搜索结果是1,860,446 results,但是water bottles在前台的搜索结果是over 5 million。而且,以单数形式和复数形式出现的sponsor广告位置的产品也是完全不一样的。那么,这样来说,好像又有哪里不对劲。
我们研究以后发现,亚马逊的确能够account for stemming 在收录层面上,但是在ranking层面上并不是这样的。Water bottle 和 water bottles 在排名上面,还得分开来推,一个上了首页不代表另一个还能上首页。而且,在后台关键词那里,单数形式的关键词写了以后,别忘了复数形式也要有,有时候习惯性拼错也要写进去,这样才算是比较稳妥的做法。
测试结果三
Spiders would be more likely to index search PHRASES
按照之前大家的认知以及亚马逊官方TOS(Amazon Terms of Service)来说,亚马逊A9是根据word by word来读取收录的,而不是根据词组Phrase来抓取。也就是说你在后台里面写的:Teddy Bear 或者是 Bear Teddy,即使Teddy在标题版块,bear在后台关键词版块,对搜索引擎来说,其实是一样的。
按照正常逻辑来讲,因为机器并不是人,机器并没有所谓的惯用表达,Teddy Bear 或者是 Bear Teddy 对于机器来说,并没有任何的区别。但是,最近一些测试发现结果并不是这样的。
我们据此做了一个测试,针对关键词:essential oil diffuser。其中 在listing A 里,这三个词是放在一起的, 但是在listing B里, 这三个词并不是在一起:oil diffuser 出现在标题,essential 出现在五点描述。然后同时开始推A和B,结果发现essential oil diffuser在一起时出现的listing A,基于这个词的排名来说,它的效果权重要远远好于listing B。
经过大量类似的测试,我们可以得出结论: 虽然从收录本身来看,亚马逊是根据word来收录的,但是从ranking角度来说,更符合逻辑语序的词组在ranking上面更具有优势。
那么,我们以后在运营推广的时候,特别是一些长尾词,最好在后台填写的时候,要让它以词组的形式完整出现,而不是东一个西一个,胡乱堆放。
按道理来说,标题出现过的词,在search term里面就不用再出现了,但是如果有些词组在标题里面不是连在一起的,那么我们可以在search term 上面让他们连在一起。这是个细节,大家以后可以注意一下。
今天的内容就到这里了,大家看测试的结果很容易,但是测试的过程是需要大量的数据和反复论证的。我们团队至始至终有着非常好的测试传统,这也是能够保证立于不败之地的关键因素。
我之所以这次讲出来整体的推演过程,也是希望各位老铁能够从思路和方法上面获取更多的东西,开发更多的脑洞,就像咱们初高中学数学,老师总会花两节课时间告诉你公式是怎么推导出来的,而不是仅仅让你死记硬背公式,目的也是一样的,希望大家能有自主学习以及独立思考、独立钻研的能力。 这也是我的初衷和愿景。
原文时间:20180324