关于百度收录的那些事儿

发布于:2017-07-01   编辑:admin 浏览:

SEO之路上未免会遇到一些奇葩的事件,比方网站改版了还收录旧的URL地址、测试网址平白无故就被收录了导致正式网址不被收录、换了IP成果导致百度收录不更新了等等,大多数的时候大家都把问题的起因归纳于百度,百度切实有些委屈,中国服装网seo负责人飞鹰正义在工程师的指导下为大家揭开这神秘。
在开端前先简略的给大家讲授一点小常识:
域名跟 IP相称于站点的名字跟 身份证,IP相称于现现在的身份证,然而身份证IP地址很难记,所以就发生了域名。这里不是给大家遍及历史常识,只是当初大多数情况下都采取域名来拜访所以导致大家疏忽了一个事实:终极寻址的是身份证号码也就是IP,不是域名!来看个域名解析的简化进程图瀑走图片

通过这里大家应当明确一些了吧?域名只是便利咱们记忆,而真正的寻址的应当是IP!大家都晓得域名DNS服务器在寰球有N个节点,咱们新域名刚解析的时候常会遇到某些区域由于DNS数据同步慢而导致拜访不了的情况,而老域名换IP的时候也会遇到用户拜访的仍是老IP的设想。这你都晓得?别急你还有不晓得的!

然而咱们的搜寻引擎蜘蛛大多数散布式抓取,本身都建有DNS,一来解决抓取的时候的效力,不用每次都要解析IP后抓取,二来咱们站点的主体表示情势都是域名,而不是IP,所以带着咱们的域名host头去拜访咱们的老IP仍是会拜访的到,因而就会导致咱们开头提到的一些奇葩怪象。说完基础概念,咱们再来具体分析一下这多少个怪象的详细成因!

一、网站改版了还收录旧的URL地址

这个问题实在跟上面的基本没啥太大关联,但天天在百度站长社区问的人切实是太多了,也算是收录的一大奇葩景象,所以在这里仍是拿出来叨一下。

许多站长网站改版了启用了新的URL构造,也在站长平台进行了改版提交,然而仍是呈现收录旧的URL,碰到这个问题首先咱们仍是从站点本身的问题找起: 百度收录瀑走图片

1.是否已经去除所有旧地址进口?
这是个严正的问题,许多友人由于站点大、构造庞杂、改版不彻底导致并不去除所有进口页面,导致新内容发生的同时在一些角落里仍是发生了老的进口,只有链接地址仍是老的就有可能被收录。所以要改版要换URL必需彻头彻尾的把所有链接调换为新的URL。为了加速生效新的链接除了站点本身链接外尽可能修正一下外部的链接,例如友情链接。

2.老的URL是否做了301到新的URL上?
老的URL是否真的是301到新的URL上面?我也碰到一些奇葩的友人应用js之类的技巧,看起来似乎也是跳转,也像那么回事,但实在基本不是一回事!

3. 对于百度方面
在做好1跟 2的基本上,即便百度收录了旧的链接,也不用担忧,由于百度对跳转属性的站点跟 链接辨认跟 确认须要一定的时间,而且只有是稳固的跳转,终极都会转换成新链接的流量,当然记得通过网站改版工具及时提交改版规矩。

二、测试网址平白无故就被收录了导致了正式网址不被收录

这里我倡议大家当前测试的时候尽量环境保障本地或者在特定测试环境下才能拜访,否则当初的各种阅读器可能会把地址流露出去,也有不警惕把地址拿去搜寻等渠道导致被搜寻引擎收录那么对你的站点上线影响仍是蛮大的。百度收录瀑走图片

1.不封闭测试服务器
上面遍及常识有提到过,大家换IP或者换URL地址的时候由于老的服务器不封闭,而搜寻引擎缓存了IP,导致搜寻引擎仍是能够拜访到这些页面;

2.不删除IIS绑定
还有一些友人换了IP地址,然而并不在老的IP上的网页服务器上删除网站绑定,导致搜寻引擎带HOST头拜访该IP的时候可能拜访到旧的内容;

个别情况下搜寻引擎缓存的时候较长,或者因cdn等因素导致IP同步失败的都会导致上述情况产生,调换ip当前,能够通过抓取诊断工具测试一下百度是否可能准确抓取,假如解析到的ip有误,可点击抓取诊断详情中的“报错”,告诉百度更新你站点的ip。

三、换IP后导致百度不收录

上面提到搜寻引擎会缓存IP,百度在换IP的时候也说过尽量保障老服务器一段时间内能够拜访,为什么要这样?由于服务器真的须要时间去同步内容同步IP,而且直接断了老的服务器很轻易导致短时间突发404,因而会给站点造成不可预估的问题;
换IP后不收录起因也是这样,由于换了新服务器数据迁徙后导致老服务器的内容并不更新,所以这个时候实在是百度基本抓取不到你的更新。因而须要通过上面的方法尽快告知百度,你站点ip的变动,减少站点流量丧失。

停止语:
实在收录奇葩问题许多,我列举了大局部可能碰到的一些奇葩问题,大局部情况下都是站长存在的一些误区所导致的。

上一篇:没有了 下一篇:网站索引量原理及不收录的原因