官方首页
 计算机科学与技术
 湖畔文学
 星之传说
 蓝色湖畔桃园
 湖畔艺术
 湖畔科技
 本站留言
热门关键字:    dreamlandcn.com    蓝色湖畔
 >>相关文章
·c#取得汉字的拼音的首字母
·Gridview实现多选及全选
·ASP的Application
·asp中缓存原理示例
·asp中使用缓存
·一听既懂泛型讲解,一懂就会啦,
·FLASH播放器-instal
·占用资源比较少的网页浏览器(G
·水仙花程序算法 C#版
·X.509证书结构第三版
 >>点击排行TOP10
·多种排序算法,多种语言讲解(前言)
·多种排序算法,多种语言讲解(简单选
·多种排序算法,多种语言讲解(冒泡排
·多种排序算法,多种语言讲解(堆排序
·多种排序算法,多种语言讲解(快速排
·【其它欣赏】少儿不宜的设计
·多种排序算法,多种语言讲解(树形选
·多种排序算法,多种语言讲解(希尔排
·多种排序算法,多种语言讲解(交换排
·多种排序算法,多种语言讲解(总结)
·多种排序算法,多种语言讲解(直接插
·VC中使用GetModuleFil
·C#中DataSet绑定XML的代
·多种排序算法,多种语言讲解(归并排
·【其它欣赏】一辆卡车车身广告引发P
 
 当前位置:网站首页 > 计算机科学与技术 > 网页技术 > 浏览正文
什么是WWW robot?
作者:佚名    来源:本站原创    点击数:   更新时间:2008年09月18 【字体:

WWW Robot是一种特殊的程序,自动遍历网页的超文本链接结构的检索文件,并递归检索的所有文件索引。

请注意, “递归”在这里并无限的定义或任何特定的遍历算法;即使机器人适用于一些启发式的,以选择的、秩序的文件访问和列出的请求,在较长的时间,和存放较大的空间,它相当于是一个机器人。

正常的网页浏览器并不是机器人,因为它们都是由人工触发浏览网页,并且不自动检索引用的文件(除图片) 。

网络机器人,有时被称为Web的流浪者,网页检索器,或蜘蛛程序。这些名称有些会让人引起误导,因为他们给人的印象好比软件本身的动作之间的网站,像病毒,事实却并非如此,机器人只需从网站中访问网站的文件。

来源于 http://www.robotstxt.org/faq/what.html

A robot is a program that automatically traverses the Web's hypertext structure by retrieving a document, and recursively retrieving all documents that are referenced.

Note that "recursive" here doesn't limit the definition to any specific traversal algorithm; even if a robot applies some heuristic to the selection and order of documents to visit and spaces out requests over a long space of time, it is still a robot.

Normal Web browsers are not robots, because they are operated by a human, and don't automatically retrieve referenced documents (other than inline images).

Web robots are sometimes referred to as Web Wanderers, Web Crawlers, or Spiders. These names are a bit misleading as they give the impression the software itself moves between sites like a virus; this not the case, a robot simply visits sites by requesting documents from them.

 
Tags:dreamlandcn.com
Google
关于我们 | 服务指南 | 著作权与商标声明 | 法律声明 | 服务条款 | 隐私声明 | 诚征英才  | 友情链接
Powered by ACTCMS 2.0
Copyrights©2008-2009 蓝色湖畔 www.dreamlandcn.comAll Rights Reserved. 滇ICP备05000680号