谷歌多久会更新算法
本文目录
特朗普为何炮轰谷歌
谷歌一下,净说坏话。昨天,特朗普推特炮轰谷歌,认为谷歌压制右翼媒体新闻,搜索页面96%都显示的是CNN这样的“假新闻媒体”。谷歌回应:算法没毛病,每年都改进。
昨天,特朗普发了条推特,引爆了美国媒体,大意是:
用谷歌搜“特朗普新闻”,结果只显示CNN这些“假新闻媒体”的观点或报道,而共和党、保守派以及“公平媒体”被拒之门外。
特朗普还引用的一组数据:在“特朗普新闻”的搜索结果中,96%的都是左翼媒体,而保守派的出版物却被压制,非常不公平。
换句话说,特朗普认为,谷歌操纵了新闻,所以“几乎所有的新闻和故事都是坏的”。
谷歌是否正在操纵算法,优先考虑来自左翼新闻媒体的搜索结果?
特朗普的推特不是乱喷,他指出的“96%”的数据,出处来自一个名为PJ Media的一项调查(其实PJ Media是右翼网站)。
在这项调查里面,Google输入“特朗普新闻”,搜索结果第一页出现的媒体除了CNN外,其他左翼网站还有CBS,Atlantic,CNBC,纽约客,Politico,路透社和今日美国(此列表中的最后两个网站可能被认为比其他网站的立场更中立)。
搜索结果的第一页上没有出现任何一个右翼网站。
而前100个结果,情况变得更糟。
CNN出现频率最高,高达21次,几乎是第二名《华盛顿邮报》(11次)的两倍。其他左翼网站出现频率也很高,分别是NBC(11次),CNBC(8次),Atlantic(5次)和Politico(5次)。
排在前100名的中的右翼网站只有《华尔街日报》和Fox新闻,分别为3次和2次。
PJ Media没有出现在前100个搜索结果中,其他一些右翼新闻网站,如National Review, The Weekly Standard,Breitbart,The Blaze,The Daily Wire,HotAir,Townhall,RedState等保守立场网站均未进入前100名,除了上面列出的《华尔街日报》和Fox新闻。
以下是前100个搜索结果中最常出现的网站:
如下图所示,在用谷歌搜索“特朗普”时返回的文章中,来自CNN网站的文章比例格外高,占总数的近29%。而事实上,搜索结果中,左翼网站文章占总数的比例高达96%。
换了不同的计算机,使用不同的帐户多次执行了搜索,Google都返回了类似的结果。虽然这个统计方法不是很科学,但结果表明,谷歌搜索确实存在对右翼内容的偏见。
除了网站之外,美国媒体人Sharyl Attkisson曾制作一份媒体偏见图,这份图表也被PJ Media引用,具体如下图所示。
有趣的是,Sharyl Attkisson曾在CNN工作三年,但她后来发现,CNN有专门的“白宫批评组织”,因此,她认为媒体在很大程度上是批评白宫的,但她认为媒体应该作为一个推动叙事的无偏见的仲裁者,于是才有了上面这张“媒体偏见图”。
谷歌回应:每年改进算法,没有政治偏见
特朗普的一番推特炮轰后,白宫表示将调查“算法偏见”,白宫的一位经济顾问也表示,政府正在“看一看(We're taking a look at it)”监管的可能性。但白宫和特朗普都没有详细说明他们将用什么法律理由来调查谷歌。
国会消息人士说,特朗普可能很难找到一种方法来向谷歌调查新闻搜索结果,国会不太可能通过任何适用的法律。并且,美国联邦通信委员会在废除网络中立规则时放弃了对在线通信管理的管辖权。
谷歌随后也回应了特朗普的评论:
当用户在Google搜索栏中输入查询时,我们的目标是确保他们在几秒钟内收到最相关的答案。搜索并不用于制定政治议程,我们也不会将结果偏向任何政治意识形态。
每年,我们都会对算法进行数百项改进,以确保他们能够根据用户的查询显示高质量的内容。我们不断努力改进Google搜索,从不对搜索结果进行排名以操纵政治情绪。
这则回应有理有据,听上去也理直气壮,但谷歌能挺多久没人知道。
因为谷歌显然在一定程度上控制了信息如何呈现给用户,只不过对许多人来说,问题是谷歌对这一过程的干预力度有多大。
谷歌的算法,尤其是搜索算法,是一种主算法( master algorithm),可以实时地应用到每次搜索查询中。尽管算法本身经常随着谷歌的调整而发生变化,但它在每次搜索时的应用都是相同的。
如果搜索结果因人而异,那可能是因为用户使用的浏览器是隐身模式,这会删除 Cookie和其他第三方跟踪软件。或者他们搜索时所处位置不同,触发了谷歌返回本地结果。
美国东北大学计算机科学教授 Christo Wilson研究谷歌的搜索实践已有 6年,他的研究涉及到比较不同条件下的谷歌搜索结果——例如,让一组测试人员匿名使用谷歌搜索,而另一组在正常模式下使用谷歌搜索。在其他研究中,Wilson让一组人登录 Fox News,另一组人事先浏览 CNN新闻,然后进行同样的谷歌搜索。
“我们从未发现很大的差异。事实上,你的搜索历史只会影响大约 10分钟,甚至对大多数查询来说搜索历史毫无影响。”
他解释说,这可能是谷歌对新鲜度“偏见”的结果。这可能也是特朗普所经历的。Wilson说:“特朗普搜索得到的结果和每个人搜索同样的关键字得到的结果都是一样的,至少在美国是一样的。”
Google搜索结果如何排序是最头疼的部分,目前还是PageRank算法
从较高的层面看,谷歌搜索引擎基于一长串的网站。谷歌使用“爬虫”的自动化软件从这些网站中收集信息。爬虫程序会收集互联网上网站的关键词和其他数据,已经有数十亿网页被通过这种方式分析。
谷歌官网对其搜索算法的说明:
您需要的是答案,而不是数十亿个网页,因此, Google排名系统会对 Google搜索索引中的数千亿个网页进行筛选,以便瞬间就能为您提供实用且相关的结果。
这些排名系统由一系列算法组成,而这些算法用于分析您要查找的内容以及要返回给您的信息。在改进 Google搜索以使其更加实用的过程中,我们优化了这些算法,以便更精确地评估您的搜索内容和结果,从而改善我们的各项服务。
以下是 Google使用搜索算法从网络中返回实用信息的一些方法:
当用户输入搜索查询时,谷歌会接受他们的请求,并在其记录中查找任何匹配项。然后它面临另一个问题:如何排列所有的结果。
这就是谷歌搜索引擎中更加主观的部分。它要考虑超过 100个因素——从用户所在的位置到某个网页最近更新的频度——这些因素决定了某个结果可能出现在多前的位置。
此外,谷歌搜索著名的PageRank算法是由其共同创始人拉里?佩奇(Larry Page)和谢尔盖?布林(Sergey Brin)开发的,该算法在确定给定来源的权威性方面起着重要作用。
谷歌官网对其搜索排名的说明:
为了帮助将最符合需求的网页排在靠前的位置,我们还编写了算法来评估这些网页的实用性。
这些算法会分析数百种不同的因素-从内容的新鲜度,到您的搜索关键词的出现次数以及网页能否提供出色的用户体验-以尽力呈现网络所能提供的最有用的信息。
为了评估内容在相关主题方面的可信度和权威性,我们会寻找那些看起来在类似查询中受到大量用户青睐的网站。如果与该主题相关的其他知名网站链接到了相应页面,则可充分说明此页面上的信息具有较高的品质。
谷歌高管们在讨论谷歌软件的具体细节时犹豫不决,因为他们担心这会鼓励那些想要玩弄算法的人。特朗普批评的一个核心方面就是,谷歌最初的分配权值的方式就是错误的。
但是,谷歌搜索排名团队的负责人 Pandu Nayak说,谷歌会与普通人一起测试自己的搜索结果,以确保搜索引擎能够达到它的意图:提供相关且权威的结果。
“我们已经制定了一系列关于‘权威’的意义的详细指南,”Nayak表示,“这份指南长达160页,已经在网络公开发表了好几年,它就是我们对提供相关且权威结果的意义的表述。”在参与评估过程之前,评估者必须对其进行研究,并通过测试。
谷歌用AI推荐新闻,媒体机构想方设法提高自己的出现率
谷歌新闻最近的改版已经使它变成了一个更加个性化的产品,它使用人工智能来满足用户的偏好。
这种方法引发了人们的疑问:是什么决定了 Google News首页显示的结果,以及它的工程师对 AI正在做出的决策在多大程度上是真正了解的?
在当前的机器学习研究中,一个一贯的主题就是“算法是黑箱”——通常,确定算法决策原因的唯一方法是尝试从其结果逆向工程逻辑。
不过,公司和个人似乎都可以影响谷歌的搜索结果。
逆向工程在谷歌实际上已经成为一种作坊式工业,特别是在媒体方面。新闻出版方一直在努力寻找在 Google News和 Google搜索上争夺知名度的方法。例如,谷歌倾向于支持“新近度”或“新鲜度”,鼓励像“华盛顿邮报”这样的公司用元数据关键字创建他们的网页,以便搜索引擎可以轻松读取。
谷歌当然有能力定制搜索结果,但定制行为往往比想象的要少。
谷歌和百度的算法究竟有什么不同
收录时间
从新站收录的时间来讲,google快于百度,百度对于新站不会立刻收录,甚至相当长的时间内都不会收录,只有通过百度的考验期后,百度才会大量收录该站点内容,这需要很长一段时间,同时都会让站长们感到焦急。
区别二:内链规则
Google基本不考虑链接的深度问题,他所考虑的是符合检索者,所以很多低一级的目录页面很容易得到好的排名。而百度对待链接深度有一定的等级制度,首页权重最高,内页则会下降一个等级。
区别三:排名优化规则
google比百度慢,因为对于新站google有一个沙盒效应,新站优化的再好,六个月之内也可能没有很好的排名!不过沙盒是可以避免的,这就需要SEO人员去好好规划和设置了!因为google排名本身就比百度慢!优化不可一下子过多,要循序渐进,不能操之过急。百度可能当你收录后就可能排名很靠前,而Google不会这样,当然各搜索引擎排名也有其自身不确定的因素.需要各站长们自己在seo实践中进行总结。
区别四:内容喜好偏重
百度偏重于游戏,娱乐,音乐,休闲生活等类;google偏重于技术类, google像一个技术前辈,喜欢原创,也喜欢有技术含量的东西。其中有很多判断原创的因素,其中就有网页的反向链接,收录的时间,PR值的高低等等,很多因素加在一起决定了你的网站的排名和权重。
区别五:外链权重
谷歌重视的是链接的相关性,百度不仅重视相关性,而且还考虑连接的广泛度。所以新站需要投放大量的高质外链来增加网站的权重。不管怎样,只要是高质量的站点,百度和Google都会喜欢的。
收录要多久
问题一:百度收录要多久坚持每天更新,一般10-15天可以收录。
如果内容都是原创的话,并且坚持每天更新,一般一周左右可以收录。
上面只是经验。
百度官方说法是3个月内。
问题二:百度一般要多久才能收录一个新网站一般说来,百度收录一个新网站的时间是20天,但不等于到了20天它一定收录的。
要知道,百度、谷歌等搜索引擎对新提交的网站都有一种深深的怀疑,一般都有1-3个月的考查期,往往同一搜索引擎对不同的新站考查也有所不同,或者是迟迟不收录,或者是收录之后相当一段时间内收录没有增加、百度快照停滞不前,甚至还有的开始收录情况出乎想象的好,但过些时间又掉下来了,只剩几十条收录,或者象朋友所遭遇的情况,先收录,又删除,以上情况都是正常的。
为什么搜索引擎会对新站抱有怀疑态度呢?因为做网站是一个长期的持久战过程,搜索引擎必须对自己的用户负责,这样想也就正常了。
面对这样的考查朋友你只有继续每天定时规律性录入信息(要保证有一定的原创内容,),让每一个上到你网站访问的网友及搜索引擎看到你网站是有价值的;其次是每天规律性增加外链――譬如说,朋友这次百度知道发问在正文中带上网址,这就是一条优质外链,但朋友你却没有,只有做好网站原创内容的上传及外链工作,百度、有道、谷歌、雅虎、腾讯搜搜、搜狗才可能尽早地收录贵网站并会不断增加对于贵网站内容的收录。
但我必须提醒朋友的是:任何网站都不是十全十美的,在此期间,千万不能相信任何调整网站结构,导致搜索引擎快速收录的具体有效方法或网站优化措施,现在处于新站考查期,甚至调整网站标签都可能招致搜索引擎的关注,延长考查期的,切记!
问题三:新站一般要多久百度才能收录一般新站上线后,百度会在15天―一个月时间内正常收录。
新站上线后,不要频繁改动,定期更新网站内容,向百度提交网址,等方法也会加速百度收录时间。
问题四:新网站一般多长时间会被收录新站,没有任何推荐的情况下,一般需要较长的时间才收录,如果有其它网站做个友情链接,就不一样了,可能收录会快些的。。查看原帖>>
问题五:我的新网站收录一般要多长时间新站,没有任何推荐的情况下,一般需要较长的时间才收录,如果有其它网站做个友情链接,就不一样了,可能收录会快些的。。查看原帖>>
问题六:百度收录多长时间收录一次呢每个人都不一样有的是秒收有的是当天收录有的是隔一天收录有的是好几天才收录这和收录的质量是有关系的但并不一定原创的就会收录还有蜘蛛来抓取的时间方面也有的收录不能去规定有时候真的只有收录了才会明白没必要去深层的研究多久收录这个问题没有结果意义也不是很大
问题七:在百度里面提交了我的网站要多长时间才能收录?您好!在百度提交网站后,需要一周或一个月时间才能收录,同时您要确保您的网站拥有一定的内容,最好是原创的,因为百度的算法这几年有了很大调整,比较看重网站质量,我的网站一周就被收录了,但三个月后又不收录,这都是因为网站的质量所决定的。您可以考虑调整一下您网站的内容重心。
问题八:新浪博客收录要多久?不一定的。。
先提交连接。。发发外连。。写些内容先吧。。
快还要一个周左右吧。。慢的一两个月都不一定的。。
星客吧 XKE8
问题九:网站提交后,百度一般要多久才能收录你提交的是网站首页吗如果提交的首页地址三四个小时就可以审核通过并且放出来当天快照不过只是收录首页
如果你网站有内容的话那么需要至少3天才可以收录少部分内容页面
问题十:网站做好后要多久可以百度收录二、网站版面的设计风格:网站版面最好设计的简洁,下载速度要快,菜单最好用可以复制的文字,不要把菜单做成图片或者是动画。
三、网站的友情链接:新开通的网站是没有人访问的,要找一些优质的网站进行连接,连接的数量在20个左右,连接的时候选择网站的主要产品或服务的词语作为连接名称;新站做好后,找3~5个朋友交换友情链接,只要3~5个足够了。
四、到百度的免费登陆入口出提交自己的网站;
五、最后还有一个最重要的就是选择一个高速、稳定、安全的虚拟主机空间摆放自己的网站;网站空间如果不稳定,百度是不会收录你的网站的。我们建议选择有独立IP的虚拟主机,这样搜索引擎会认为网站质量很高,提高收录级别,建议购买我们新网的虚拟主机。
六、网站资料的更新:信息才是网站核心,网站开通后,要不断的更新信息,保证信息的原创性。
七、适当利用百度知道。我新站做好后除了交换友情链接,还会到百度知道找相关的问题进行回答,并且附带上链接。这里有7点经验分析:
1.注意要在“待解决问题”里回答,这样才能留下链接。
2.找相关的问题回答,让你的回答看起来有价值,而不是为了链接而随便找个问题乱写。
3.在待回答问题页面内,没有其他导出链接:这样你加上后该页面只有一个导出链接,蜘蛛想往外爬,就只好走你这条路。
4.找文字内容多一点的页面:例如已经有人做了几百个字的回答,你再补充一下并带上链接,这样的页面会增加你链接的相关度。
5.我每次只回答2个问题,每个问题留下1~2个链接。我怕几分钟内留太多链接,引起百度注意。当然这可能是我多虑了。
6.如果找不到合适的问题时,可以注册多个百度帐号,自问自答,页面质量就会更高。
7.待解决问题的页面,百度都是没收录的,你可以随意找几个待解决问题的url,到百度里搜索一下试试。当你回答问题完成后,跟踪一下该页面的收录情况,一旦该页面收录后,你的页面就快了。如果再凑巧百度索引更新,收录效率会出奇的高。就在上次百度更新的时候,一个实验站仅2天site直接从0到162,完成全站收录。
是不是很简单,只要你做到这几点,百度在5天之内就可能收录你的新站。百度收录从0到1的经验,也是我自己惯用的方法。那么收录后给予相应的权重参与排名又需要多长时间?