1.站点安全技术不靠谱
那些经常被黑被篡改的网站,证明自身的安全技术非常薄弱。一般被黑有常见几种情况,一种是主域被黑,一种是标题被篡改,还有一种是在页面里面加 了很多的外链。一般主域被黑就是被劫持,就是主域被进行301的跳转到指定的网站,而如果在百度那边发现跳转后的是一些垃圾站,那么你这个站点抓取量就会降低。
2.网站自身的质量不高
①网站的前台模板构造,使用更适合搜索引擎的div+css布局,精简代码,提高网页打开速度。
②网站的内容:网站的基础是建立在内容之上的,网站必需事先要设计好,有一定的内容,最好是原创的程序,采集的数据会对站点有影响!
3.站点响应速度不够快
①网页的大小会影响抓取,百度建议网页的大小在1M以内,当然类似大的门户网站另说。
②代码质量、机器的性能及带宽也是影响抓取的因素。