前端开发入门到精通的在线学习网站

网站首页 > 资源文章 正文

理解万维网,必须要懂的基本概念(了解万维网的基本结构)

qiguaw 2024-09-06 21:05:19 资源文章 18 ℃ 0 评论

万维网即 World Wide Web,是非常普遍的互联网应用,每天都有数以亿万计的Web资源传输,我们平常通过浏览器上网就是Web。

通过浏览器上网的流程,如同我们去餐厅吃饭的流程,我们在浏览器上输入网址,然后浏览器会把网站的资源返回到浏览器上。

实际上,这是个很复杂的流程,而且在这一过程中,途中会通过路由器、光纤、dns

服务器、防火墙、交换机、服务器等硬件设备。而且,可能会遭受黑客的攻击。

最常见的web客户端就是web浏览器,web浏览器向服务器请求HTTP对象,并将这些对象显示在你的屏幕上。其他的客户端还有"网络蜘蛛"(spiders)、"web机器人"(Web robots)等。这些客户端还被称作Agent代理,可以代表用户发起HTTP请求,后面提到的"网络蜘蛛"、"web机器人"都是自动代理,可以在无人监视的情况下,自动发起HTTP请求并获取相应内容,也就是我们常说的"网络爬虫"。

web服务器是web资源的宿主,每天都有数以亿计的图片、HTML页面、视频、音频等资源在互联网上传输,而这些资源信息都是存储在web服务器(由于web服务器使用的是HTTP协议,所以也常常被称作HTTP服务器)上的。如果客户端向服务器发送HTTP请求,服务器会在HTTP响应中回送所请求的数据以及其他一些数据信息,包括对象,对象类型,对象长度等。

Web上可用的每种资源 HTML文档、图像、视频片段、程序等,均由一个通用资源定位符(Uniform Resource Locator, 简称"URL")进行定位。这个就像是快递地址一样,快递小哥根据你的地址才能找到你你给你快递,然后你返回给快递小哥一个签收单,而这个地址在世界范围内唯一标识并定位资源信息。 URL支持多种协议,比如http、ftp。

从上面的URL可以看出,一个完整的URL包括以下几部分:

1.协议部分:该URL的协议部分为"http:",这代表网页使用的是HTTP协议。在Internet中可以使用多种协议,如HTTP,FTP等等本例中使用的是HTTP协议。在"HTTP"后面的"//"为分隔符

2.域名部分:该URL的域名部分为"host"。一个URL中,也可以使用ip地址作为域名使用。实际应用过程,是将域名通过dns服务器,解析为ip地址。

3.端口部分:跟在域名后面的是端口,域名和端口之间使用":"作为分隔符。端口不是一个URL必须的部分,如果省略端口部分,将采用默认端口

4.访问资源的路径:主要包括虚拟目录和文件名,从域名后的第一个"/"开始到最后一个"/"为止,是虚拟目录部分。虚拟目录也不是一个URL必须的部分。本例中的虚拟目录是"/path/"

5.参数部分:从"?"开始到"#"为止之间的部分为参数部分,又称搜索部分、查询部分。本例中的"query-string"。

6.锚部分:从"#"开始到最后,都是锚部分。本例中的锚部分是"anchor"。锚部分不是一个URL必须的部分

访问Web过程中,客户端与服务端主要通过http协议进行通信,http协议是超文本传输协议,即Hyper Text Transfer Protocal。HTTP是个应用层协议。HTTP无需操心网络通信中的具体细节,这些细节全部交给通用的可靠的互联网传输协议TCP/IP。

http协议包括请求消息Request和响应消息Response

http请求包括get、post、put、delete、options、refer等基本方式。

http响应会有返回状态码,常见的状态码,如下

200 OK //客户端请求成功

400 Bad Request //客户端请求有语法错误,不能被服务器所理解

401 Unauthorized //请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用

403 Forbidden //服务器收到请求,但是拒绝提供服务

404 Not Found //请求资源不存在,eg:输入了错误的URL

500 Internal Server Error //服务器发生不可预期的错误

503 Server Unavailable //服务器当前不能处理客户端的请求,一段时间后可能恢复

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表