什么是Cloak?Cloaking简介
有粉丝在给我私信,老王,最近写的都是一些很简单基础的东西。的确是这样,现在关注的粉丝多了,水平参差不齐。有大佬,也有小白,所以我有时候也不太明白写哪方面的。
因为最近被Google的规避系统搞得有点头大,所以今天聊聊Cloak系统。
Cloak的本意是“披风”,是一种松散的服装。 可以参考维基百科。https://en.wikipedia.org/wiki/Cloak 但是它的隐喻是任何掩饰或掩饰的东西。
老外是这样定义Cloak的
Cloak is a search engine optimization (SEO) technique in which the content presented to the search engine spider is different from that presented to the user's browser. This is done by delivering content based on the IP addresses or the User-Agent HTTP header of the user requesting the page. When a user is identified as a search engine spider, a server-side delivers a different version of the web page, one that contains content not present on the visible page, or that is present but not searchable. The purpose of Cloak is sometimes to deceive search engines so they display the page when it would not otherwise be displayed (black hat SEO). (Cloak是一种搜索引擎优化分别呈现给搜索爬虫和用户不同内容的技术,通过识别用户IP或者HTTP请求头部,呈现出不同的内容。如果当Cloak程序判断出,这个用户是搜索爬虫,服务器端的脚本会给爬虫一个对于普通用户不可见的且版本不同的页面。Cloak的目的有的是为了欺骗搜索引擎呈现给用户不应该呈现的页面,是一种黑帽SEO的方法;)
Cloak is often used as a spamdexing technique to try to trick search engines into giving the relevant site a higher ranking. By the same method, it can also be used to trick search engine users into visiting a site that is substantially different from the search engine deion, including delivering pornographic content cloaked within non-pornographic search results.(Cloak经常被用作欺骗搜索引擎而获得更高排名的垃圾索引技术。同样的,这种技术也被应用到欺骗搜索用户去访问一个与搜索引擎描述不同的网页,例如搜索引擎索引的是非色情的页面,但是通过搜索引擎打开这个网站呈现用户的却是色情的内容)
上面的话是不是还是不太好理解,我给大家翻译成最通俗的人话。Cloak 就是一种伪装技术,可以根据IP、浏览器、ISP 、屏幕分辨率、http协议等来判断,从而展示特定的内容,屏蔽爬虫等。
Cloak技术的应用场景有哪些呢?
黑帽SEO,违规跑offer、FB投广告、Google 投广告、 防止别人Spy等。
比如在Facebook推广一些敏感的产品,审核广告的时候,我们就需要一个安全页面用于广告审核,另一个真实的页面给目标受众。能达到这个效果的,就是Cloak程序。
又比如在FB或者Google平台违规跑offer,利用Cloak,发现是FB、Google的爬虫或者真人,就给他们看一个安全的页面,通过审核。如果是面向的受众,则可以把Landingpage或者 Offer的页面展现给他们。
现在的Spy工具很多都是爬虫模拟真实用户(UA)去抓你的广告和Landing Page。这时可以根据这些爬虫的特征设计Cloak程序,让爬虫只能抓到假页面,这样可以有效防止实际推广真页面的泄露。
因为我们主要是投放Google和FB的广告,所以Cloak对于我们来说,最大的作用就是通过广告的审核。
Cloak的安装
1、PHP,将一个生成的PHP文件放到你的网站目录里,命名为index.php,这样当访客访问,就会触发cloak。这种方式最为常见。也有将部分PHP代码放到本来就存在的页面里。这两种方式其实都是利用PHP 程序来判断。
2、JS,加入一段Java script的脚本,这种嵌入更方便,但是从执行效率和最终效果来看,没PHP好。
3、API,利用程序提供的API接口,把访客的信息提交给Cloak服务器,服务器判断后再返回。对于非程序员来说,接入比较麻烦。
Cloak程序的原理不难,但是要做到100%的准确识别也不简单。因为这就是攻防战,攻防的双方都在不断的升级,不断的提高技术。
我之前也写了个简单的Cloak.
通过API查询IP的地址、属于哪个ISP、判断访客操作系统、判断访客分辨率…
最终还是能判断出FB的爬虫。