最近SEO界有一个大家比较关注的事情,Zac的博客被百度惩罚了.
一向坚持原创,坚持技术写作,不交换链接,也没有针对wordpress博客系统有任何过分的优化,更不会有什么群发垃圾的行为.为什么百度要惩罚呢??偌大一个博客,被百度只留下了几个页面.
点石论坛里,都在猜测:
是因为zac 的博客空间在国外,百度只关心国内的ip?
还是百度不喜欢zac,想惩罚就惩罚?
是301什么跳转的问题???
难道是zac偏偏要加seo8.net这个被百度删掉站点的链接?
当然,在技术分析之前,得假设百度是永远没有任何问题的.
于是我几测试百度里还剩下的几个页面
一个一个点进去,或者看网页快照,发现收录的每个页面都是下面这种格式
http://www.chinamyhosting.com/seoblog/index.php?image=1151725809
只是后面的数字不同,
而且image后面的数字可以自由地修改,
点进去都能访问到zac博客的首页
百度抓取动态页面的能力极强.
因而抓取了大量这样的类似的页面.
百度感觉被欺骗了吧,:一个首页就可以抓成无数个一样的数据.
那么惩罚zac也就可以理解了.
这是百度算法的一个漏洞,
但所有的wordpress博客系统似乎都有index.php?image=12211这样的问题
为什么偏偏zac呢?
当然,zac之前为了测试一些seo的东西,将顶级域名301到了博客首页
难道这些导致了百度的程序出错?
不管如何,有一点可以肯定,那就上wordpress系统在某种情况下,会导致百度的爬虫内分泌失调
引发对你站点的惩罚
在分析过程中,还发现一个问题,
象点石论坛这样需要注册后才能登陆发言看帖子的论坛
居然百度也照样收录了
而且通过网页看照可以阅读到帖子的内容
看来百度抓内容真的是抓疯了!