官方首页
 计算机科学与技术
 湖畔文学
 真缘不夜天
 湖畔艺术
 湖畔科技
 本站留言
热门关键字:    dreamlandcn.com    蓝色湖畔
 >>相关文章
·经典的asp代码分享
·ASP文件无组件直接上传功能
·ASP中利用服务器组件 用st
·使用ASPJPEG让图片保存到
·ASP中很好用的防止盗链的方法
·常用的6个ASP程序
·本站首页模板已更改完成
·旗袍碎语--让年轮倒转,让美丽
·陈果导演的“香港回归三部曲”
·北京奥运 完美谢幕
 >>点击排行TOP10
·多种排序算法,多种语言讲解(前言)
·多种排序算法,多种语言讲解(简单选
·多种排序算法,多种语言讲解(堆排序
·多种排序算法,多种语言讲解(快速排
·【其它欣赏】少儿不宜的设计
·多种排序算法,多种语言讲解(冒泡排
·VC中使用GetModuleFil
·多种排序算法,多种语言讲解(树形选
·C#中DataSet绑定XML的代
·多种排序算法,多种语言讲解(希尔排
·【其它欣赏】一辆卡车车身广告引发P
·多种排序算法,多种语言讲解(交换排
·多种排序算法,多种语言讲解(直接插
·如何使用 Visual Basic
·多种排序算法,多种语言讲解(总结)
 
 当前位置:网站首页 > 计算机科学与技术 > 网页技术 > 浏览正文
GOOGLE搜索引擎蜘蛛的等级
作者:佚名    来源:本站原创    点击数:   更新时间:2008年08月26 【字体:
GOOGLE搜索引擎蜘蛛的等级:

首先先谈下GOOGLE蜘蛛起源:

当GOOGLE搜索引擎刚建立之初,就拥有这一个非常强大的的服务器,

其每天放出大量的蜘蛛,我们称为1号蜘蛛,其抓取量抓取速度是非常的快,

对其整个互联网每天进行信息进行的采集,可见服务器的速度是多少快,其实最主要的是后期GOOGLE

将服务器延伸到了很多城市,所以现在你能发现GOOGLE的运算速率是超前的快.

服务器将采集的信息分类,整理.到庞大的数据库.

其中有个数据库都是用来存网站域名的.

域名只要被搜索引擎索引到,将自动存入此数据库.

此数据库是1号蜘蛛的核心.

其内部分为10个PR各等级的小数据库,虽说小数据库,但也是大的可怕-。=!

10个等级的数据库 其周期也不同

基本上以一个PR=4的网站来讲 1号蜘蛛爬行的概率也在7天一次.

所以基本你也会发现收录有大的幅度也是在7天内的某一天 .

细心的站长会发现其实有时候7天还是蛮准的,但只针对PR=4

越是PR高其周期越是短,越是PR低周期越长,

当然说到这很多站长有这样的疑惑.会觉得蜘蛛有时天天收录他的站

这里对其收录的也就是接下来要说的2号蜘蛛

2号蜘蛛往往是在1号蜘蛛爬行过程中放出去的,

主要针对于被1号蜘蛛爬过的网站的外部链接.

PS既然都说是2号蜘蛛 肯定其抓取力度要比1号小很多.

当然不只是有2号,还有3号蜘蛛

所谓3号也就 A站1号蜘蛛爬行到B站,B站的2号蜘蛛爬行到C站

目前GOOGLE为了限制其无限的循环对于蜘蛛只分为这三个等级.并对其等级的抓取率有个很明确的标准

而且2号与3号蜘蛛有个抓取特点 基本以时间的先后顺序进行抓取

比方讲:

A网站被1号蜘蛛爬行后的一篇文章最后时间为 2008-6-1

那当A网站被从别的网站过来的2号蜘蛛给爬行,首先有可能会对其收录的是

最近发表的几篇文章如: 2008-5-31等 2008-5-30等文章将会进行第2次,第3次的访问

之后再爬行2008-6-1以后的信息.如果你网站没有任何更新,它将对其近一个月内的更改内容进行2次爬行.

如果外部来的2号与3号蜘蛛越多,同一篇文章有可能会被爬上好几次.

以下为GOOGLE提供的官方数据<秘>

1号蜘蛛

基本抓取率在5%~10%

基于PR=0 没有任何导入链接与提交时 有可能被抓取的周期在6个月~12个月不等

基于PR=1 没有任何导入链接与提交时 有可能每次被抓取的周期在4个月~8个月不等

基于PR=2 没有任何导入链接与提交时 有可能被抓取的周期在2个月~4个月不等

基于PR=3 没有任何导入链接与提交时 有可能被抓取的周期在1个月~2个月不等

基于PR=4 没有任何导入链接与提交时 有可能被抓区的周期在1周~1个月不等



当然没有任何导入链接的网站无法做到PR=4

最高也只有PR=3

上述此数据只是GOOGLE官方提供的一个基数.

意思也就是1号蜘蛛主动爬取你网站的周期数.

对于2号或者3号蛛爬取你的网站,也就根据你的导入链接而定.

所以你会发现你的网站有时天天在被更新.

2号蜘蛛

基本抓取率是2.5%~5%<基于1号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问>



3号蜘蛛

基本抓取率为1.25%~2.5%<基于1号蜘蛛与2号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问>
Tags:dreamlandcn.com
Google
 
关于我们 | 服务指南 | 著作权与商标声明 | 法律声明 | 服务条款 | 隐私声明 | 诚征英才  | 友情链接
Powered by ACTCMS 2.0
Copyrights©2008-2009 蓝色湖畔 www.dreamlandcn.comAll Rights Reserved.