8成AI站被K,谷歌SEO如何安全用ChatGPT?
“能不能用ChatGPT批量生成英文内容,获取谷歌自然搜索流量呢?“
这是我最近听到业内大家最多的讨论,我的答案是:去年肯定可以,今年可能可以。
为什么这么说?用Semrush看3个网站数据:
牛,自然流量从0到巅峰,基本只花了6个多月的时间,单单一句“卧槽”,都不足以形容去年3月份我刚刚发现的情绪。
而且,这几个网站大概率是一位老哥的,网站采取了几乎一致的网站架构和选题策略,我没有一一进行比对,但粗略的看,前两个站可能有8成的文章采用了相同的标题,相同的内容生成策略,文章表达则不同。
从SEO知识角度的来讲,可以说,这位老哥选了上万个超低竞争度(没人写但是有少量人搜索)的长尾词去创作内容,满足所谓的搜索意图。
千万级谷歌月自然搜索流量,挂上广告联盟,妥妥的日赚斗金。
打开网站,就长下面这个样子,数千篇“问号”文章,我当时也是一头问号,“知乎?Quora?”
随机点开一篇,好长,近2000字,部分截图如下:
这么简单一个问题,生生凑出来1500+字,不,是整个网站数千问答全部超过了1500+字,有点东西。
第一感觉就是AI生成或爬虫抓的,既然是内容生产成本很低的,能搞1个,肯定会搞1堆。当你复制“How do I remove my card from DoorDash?”等等长尾词去谷歌里面搜索,你会发现一堆类似的网站,点开之后,嗯,像是一个妈生的。
不仅像是一个妈生的,而且好像还是同一年生的,2021年,离谱。
爬虫扒别人内容,用一些替换近义词,修改语序的工具,几套翻译系统来回倒腾,伪原创改改上量,做谷歌SEO可行?不是这套玩法早就烂掉了吗,怎么又死灰复燃了?
我一头问号,于是在谷歌里探索性的搜了“AI文案”等关键词,发现了一些新的AI工具,都自称使用的“GPT-3”算法,这是我第一次知道这个怪异的名词,这个时期也是国外jasperAI(调用GPT-3的API的文案生成工具)高速发展时期,同时也是我自己受害的时期,这个一会讲。
当时,我基本确定了这些网站肯定是使用了GTP-3相关的技术,但是否使用的jasperAI,不确定,因为用jasperai的话,成本还是挺高的,也可能是直接调用了GTP-3的API,站长本身有开发能力。
现在,打开ChatGPT,如何生成一篇类似的凑足2000字的HOW-TO文章呢?
是不是跟开头那篇文章截图很像?
来,换个话题:
客观说还不错,在凑字数上,以及布局相关关键词上一绝。语法用grammarly(语言检查工具)检测问题不大,原创性用copyscape.com(类似论文查重工具)检查也过关。
“牛逼,chatgtp牛逼,冲,英文站群冲一波!”
等等,别急,去年年中我也是这么想的,还没开始搞,这批站就萎了。放一张图吧,基本全军覆没,漏网之鱼有,你自己找找。
对了,你现在打开上面这个网站,域名尾缀从“.com”变成了".info",也就是说,这位站长意识到网站被谷歌判了死刑,想换个皮苟活。
看来没能如愿。
那怎么用chatgpt做谷歌SEO赚钱,凉凉?
确切的答案我不知道,但可以提供2个我在研究的思路。
第一个思路:重新定义下问题。
把“那怎么用chatgpt做谷歌SEO流量赚钱"这个问题,改成"怎么用chatgpt在知乎/Quora/Instagram/Tiktok等有搜索框的且没有AI内容检测能力的内容平台做SEO流量赚钱?
这个我想不需要详细展开,大家知道怎么做。
第二个思路:研究谷歌识别AI生成内容的判定标准,逆向使用这些标准。
思考如何避免被谷歌检测出内容是AI生成的,先要知道他识别AI内容的几个可能的判定标准。谷歌下“Check Written AI GPT-3"等相关词,可以找到很多内容检测工具,号称可识别文章是否由GPT-3为基础的chatgpt或者jasperai 生成,比如originality.ai。
准不准呢?把前面列出的那批网站放进去检测,大部分页面会得到一个"100%"的回答,也就是说被originality.ai判定这篇内容有100%的概率是由AI生成的。
我又检测了一批基本上主管判断100%确定人工写作的文章,部分是我自己的网站内容,部分是像纽约时报这样的大站点,被判定为AI生成的概率都在20%以内。
那么至少说明这个工具还是比较靠谱。
伤心的时候到了。
考虑到我自己其中1个网站排名从去年末开始流量下滑5成,一直找不到具体原因,前几天对全站的所有文章进行了检测,发现有大量的文章被originality.ai判断8成概率是AI生成,看来是被谷歌惩罚了。
大意了,被割了一刀,之前只注意内容质量,原创性语法等指标,为了省钱,把很多简单的信息类通过fiverr和upwork等平台外包给印度人写作, 现在看来,他们是用了jasperai等工具生成的。
翻看下这类似originality.ai的AI内容检测工具的原理介绍,可以大概推测出3个谷歌可能使用的判定标准,以及避免被谷歌识别出内容是AI生成3个标准逆用方向。
如果文章中有大量相似单词和短语的重复,则更容易被判断为AI生成。
这一点比较容易理解,如果你使用过chatgpt就可以感受到:问他一个非常简单的问题,一般人可能用100字回答,但是要求chatgpt使用1000字来回答,那么它会在答案里大量充水,回复文本表现出大量意思相似语句重复的特点,车轱辘话。
标准逆用方向:尽量的避免像下面这个网站一样,为了凑字数,使用相关关键词拼凑的方式,强行对内容充水,直接使用AI生成问答型内容获取长尾流量这种做法现在已经走不通了。
如果文章中单词的分布概率与检测工具调用GTP-3的API接口生成的文本,相似度高,则更容易被判定为AI生成。
这段话比较绕,我复制一下英文原文的解释:在给定左侧上下文的情况下,根据每个词成为预测词的可能性来分析每个词。如果单词在前 10 个预测单词中,背景颜色为绿色,对于前 100 个单词,背景颜色为黄色,前 1000 个单词为红色,否则为紫色。如果您看到充满大量绿色的内容,则很可能是由 AI 生成的。
标准逆用方向:避免直接利用chatgpt直接根据一个主题生成内容,而是自己提供文章的细致的大纲,然后让chatgpt在这个大纲的基础上生成内容,前提要保证:你提供的大纲与你让chatgpt直接根据文章主题生成的大纲有比较大的差异,也就是写作的角度要不同。
如果内容中包含了大量短问短答,缺少复杂长句,则更加容易被判定为AI生成。
这一点为什么我本身还没想清楚,可能是因为复杂的长句逻辑过于复杂,chatgpt比较难以驾驭。
标准逆用方向:如果你想在页面布局通过布局问题的形式,把大量的相关词塞进去,那么我建议你,在使用chatgpt生成内容的时候,把多用长句作为一个要求写进 prompt (对答提示) 中。
当然,如果你觉得以上这些点都太啰嗦,那么你可以考虑使用chatgpt生成内容后,在使用Quillbot/WordAI /jasperai等类似的AI内容生成工具,对文本进行润色和修改。
我自己经过小样本测试,发现如果在使用chatgpt生成的内容的基础上,再使用一个AI文本工具进行二次处理,那么处理后的文本使用originality.ai 检测的时候,被判定为AI生成的概率大大降低,但是,我要说一句,这并不代表谷歌识别不出。
以上。