英文网站内容外包,强哥遇到的一些坑,可能会白白浪费你的钱!
上面有一篇文章强哥也分享了外包的一些经验,今天咱们再来说说这网站内容的外包,这块我已经摸索了一段时间,而且正在持续探索中。那么今天聊什么呢?主要是强哥自己内容创作的一个SOP流程图,以及我在这个过程中遇到的一些大坑,这些坑可能会浪费你很多钱,所以大家一定要知悉。
但是如果条件允许:我认为还是要创建一个SOP的生产流程,把内容创作的每一个步骤分解,方便能把控流程,这样可以做到相对的专业与高效,这样也便于自己把控项目的进度:下面我画了一个自己的内容创作SOP流程图,这是强哥正在实践的内容SOP流程图,但不一定适合所有人。
这个SOP在推进过程中困难重重,就比如,我需要项目经理参与的时候,其实他是不乐意的,因为对于项目经理来说,他的首要任务是跟进项目,而我们市场部也不能专门去配一个工程师来做这个事,第一是语言不通,第二也没有工程师愿意来做市场。
不过最近我有和老板提了一个要求,请研发部帮忙招一个产品运营工程师。他的工作职责主要就是产品文档和文案,因为他们懂技术,所以写出来文章的专业性是可以保证的。我打算这么做,让这个工程师写出中文文案,然后让语言功底好的,相关产品的业务同事去翻译,然后再给欧美的写手改写,这样既保证了专业性,又保证了文案的地道性。不过要说明的是,我们有两个这样的工程师做着跑路了,这有点尴尬。
大公司可以有更简单的办法,就是将所有的内容外包给一家靠谱的内容机构。这是一种比较省事的办法,最近我也尝试了一下。当然这里面也会有坑,因为内容机构有很多写手,质量有好也有坏,这些机构可能会会在前面几篇文章安排好的写手给你写,合作稳定后,就会给你换成差一点的写手。
还有,找机构来做这件事,虽然省事,但是是真的贵。我曾经找到最贵的写手Agency公司,他们给的报价是0.25美金一个单词,这实在是太夸张了,咱们一般人是承受不起的。
而且找Agency还有一个坑,就是你在面试写作的时候,他们找优质的写手给你写文章,但是你们合作稳定后,他们可能会用一个劣质的写手替换优质写手,这点是我们要注意的!
除了上面说到的Agency和一些资源类写手在面试的时候文章高质量,后面就低质量的坑。那么外包写作还有哪些坑呢?那今天我就和大家一起谈一下,我在外包写作的时候遇到的一个比较大的坑:
3.1事情经过
我们前面说过,优质内容尤为重要。但是我们国内一般的人局限于英语,写出来的英文文章可能不太地道。所以,我们一般会花点钱,去找以英语为母语的外国友人代写,然后我们就去一些写作平台找国外写手,比如Fivver,problogger等等。好,写手完成文章,发给我们之后,我们就要去检查文章的质量。这其中最重要的一步,就是用文章查重工具查重,就是用工具查看他们有没有抄袭其他网站的文章内容,以确保文章的原创性。而我,就是在这一个步骤栽了一个大跟头。
PS:一般查重用的文章查重工具有三个:
http://www.copyscape.com/
https://www.quetext.com/
http://smallseotools.com/plagiarism-checker/
那么我先来说一下我发现这个坑的经过:
我其实发现这个问题挺偶然的,那天晚上,我在检查同事上传的文章,对比发现一个有意思的现象,我习惯使用“Ctrl F”来查看文章整篇文章的关键词密度。但是当时,我发现了一个特别诡异的现象:这篇Blog文章里明明有20多个关键词词根,为什么“Ctrl F”,输入关键词后,查询显示只有7个关键词,当时我就一直很纳闷,百思不得其解。如下图,这里因为涉及到自己的网站,所以我就全部打码了哈:
但是我觉得这个现象很有意思,我不能就这么放过他。所以就在当天请教了公司程序员的同事,同事告知我,这是使用了一种不常用的文字编码技术Unicode,一般正常的文字编码是ANSI编码。然后当时我就一激灵,第一反应就是可能是写手用来作弊的手法,然后在我的一番深究下,果然验证了我的这个想法,使用Unicode这种文字编码技术,写手即使整段整段抄袭别人网站的文章,这些查重工具也查不出来。我们还不知情,被蒙在鼓里,我检查了所有的Blog文章,发现有不少是使用了这种技术,惊出我一身冷汗,现在想到都觉得后怕。
3.2 Unicode编码和ANSI编码的查重工具参数对比
我们下面使用同一段英文文案,使用两种不同的文字编码方式,以smallseotool来对比一下他们的查重参数:
文字Unicode编码
结果是这段文章的查重的结果:重复率0%
文字ANSI编码
同一段文字,使用常规的文字编码,重复率变成了64%,也就是这段文字,那个写手64%是抄袭别人网站的。
需要说明的是,两种编码的文字,在word文档和谷歌翻译的搜索框里是看不出意思差别的。这也是为什么能欺骗人的原因。而且我发现很多写手会用这种手法,所以我们不得不防。其他的方法诸如西西里字母,不正常的空格等,都能达到这种效果。
3.3 Google怎样看待网站用Unicode来规避文章重复率
有的同学会问,这种技术既然能欺骗查重工具,那我把对网站的文章重新编码一下,不就是一篇全新文章了吗。毫无疑问,谷歌是不允许这么做的的,这种方法只能欺骗文章查重工具,不能欺骗到谷歌。国外有这么做的网站,很多都受到了谷歌的惩罚,所以,这种方法行不通。如果一篇文章,你改变一下文字编码方式就成了原创,那是多么滑稽而可怕的一件事。
3.4 怎样辨别文章有没有Unicode编码
步骤1:很简单,我们可以新建记事本文档,将这些Word文档上的单词复制,粘贴到这个技术本里,如果出现下面截图的情况,那就试试用了Unicode编码。我们可以看到其特征,跟正常编码的文字有很大差异,里面很字母与字母间不是连贯的,中间像是有空格,朋友们可以去试试看。但是这一种方法不能完全辨别出来,这时候,我们就要进行下一步。
步骤2:有时候即使写手用了Unicode编码技术,在记事本里的样式,也会跟ANSI编码外观一样,这时候不用慌,进行下一步,点击保存记事本,如果是常规ANSI编码,文档可以正常保存,如果弹出下面截图的提示,就是使用了Unicode编码。这里朋友们可以看到字的形态是正常的,但采用了Unicode编码。
这个坑强哥前面也提到过,这里再单独拿出来和大家一起说一下。就是我们在找写手的时候,会有一个测试文章那个的环节,这个坑发生在这个时候。这里又分为两种情况:写手是一个人和这个写手有一个写手团队。那这里他怎么坑你呢?在写文章的时候,他可能会去找优秀的写手代写,来通过你的测试,后期自己来写的话质量就不那么高。或者他自己测试的时候给你好好写,通过面试后,后面的文章就敷衍你。
如果他有一个写手团队,那就更好办了,面试的时候让优秀的写手给你写,后面让那些写作水平不高的写手来完成,这一块都怕我给绕晕了。总而言之,我们这块的内容成员一定要严格审核,不仅仅是审核有没有抄袭,还要审核文章的行文质量。还有一点我觉得是非常值得借鉴的,来自于John,他会用skype面试写手,这样面对面就能得到更多信息,靠谱多了。
以上就是我在内容外包过程中遇到的一些坑,其实每次都挺惊险的,让我受到了不少惊吓。还好发现的早,不然损失就很惨重,还极有可能连累自己的网站。其中文字Unicode编码的坑,虽然是自己偶然发现的,但也是因为我一直追着不放,才最终解决的这个问题,增长了经验,避免了大的损失。
其实生活中也是这样,如果我们在优化中遇到一些反常,有意思的现象,我觉得咱们可以去一究到底,说不定会有大大的惊喜在等着你。