目录

引言

“当输入网址后,到网页显示,其间发生了什么?”

URL

网络模型

HTTP

应用层

DNS

举个栗子

TCP

​编辑 传输层

IP

网络层 

数据链路层 

物理层

总结


引言

在学习计算机网络的时候会不会被各种协议,缭乱的机制搞得头晕眼花

从这篇文章我会和大家从头到尾了解计算机网络,说是从头到尾,实际上不会覆盖那么全面,着重讲解重要的部分(之后如果有时间会出具体细节),以点带面从而全面了解网络基础

首先从一道经典的面试题思考网络是如何工作的

“当输入网址后,到网页显示,其间发生了什么?”

URL

URL通常称为网址,首先我们了解一下URL是什么,如何通过网址找到了我们要访问的网页呢?

一般URL的组成分为 两大部分 协议目的地

我们以CSDN为例

这里的协议就是我们常说的应用层协议

域名则是我们需要访问的服务器具体地址

之后的路径则可以表示我们要访问的接口,或者某一资源等,默认情况下回去访问服务器的index.html

在大概了解了URL之后,现在正式开始在网络中穿梭

网络模型

HTTP

浏览器在接收的请求之后会对URL做出解析,并将其封装为HTTP请求

一个 HTTP 请求对象包含 4 部分内容

  1. 请求行(请求方法,URL,协议版本)
  2. 请求报头
  3. 空行
  4. 请求正文

HTTP 响应头和请求头类似,但又有所不同,响应数据包可分为以下 4 部分

  1. 状态行
  2. 响应报头
  3. 空行
  4. 响应正文

状态行用于描述服务器的返回状态,它由 3 部分组成

  1. HTTP 版本号,如 HTTP/1.1
  2. 状态码,如 200
  3. 状态描述信息,如 OK

应用层

最上层的,也是我们能直接接触到的就是应用层Application Layer),我们电脑或手机使用的应用软件都是在应用层实现。那么,当两个不同设备的应用需要通信的时候,应用就把应用数据传给下一层,也就是传输层。

所以,应用层只需要专注于为用户提供应用功能,比如上文中提到的 HTTP,又或者是电子邮件传输 SMTP 协议、文件传输 FTP 协议、网络远程访问 Telnet 协议等等

应用层是不用去关心数据是如何传输的,就类似于,我们寄快递的时候,只需要把包裹交给快递员,由他负责运输快递,我们不需要关心快递是如何被运输的。

我们将请求打包后,现在就要开始传输了,但是在发送的时候我们首先要知道对方的地址

所以发送之前,还有一项工作需要完成,那就是查询服务器域名对应的 IP 地址,因为委托操作系统发送消息时,必须提供通信对象的 IP 地址。

比如我们打电话的时候,必须要知道对方的电话号码,但由于电话号码难以记忆,所以通常我们会将对方电话号 + 姓名保存在通讯录里。

所以,有一种服务器就专门保存了 Web 服务器域名与 IP 的对应关系,它就是 DNS 服务器

DNS

在之前我们提到的URL中包含了域名,我们要找到服务器的IP地址就需要借助DNS去解析域名

DNS 中的域名都是用句点来分隔的,比如 www.server.com,这里的句点代表了不同层次之间的界限

在域名中,越靠右的位置表示其层级越高

毕竟域名是外国人发明,所以思维和中国人相反,比如说一个城市地点的时候,外国喜欢从小到大的方式顺序说起(如 XX 街道 XX 区 XX 市 XX 省),而中国则喜欢从大到小的顺序(如 XX 省 XX 市 XX 区 XX 街道)。

实际上域名最后还有一个点,比如 www.server.com .,这个最后的一个点代表根域名。

也就是,. 根域是在最顶层,它的下一层就是 .com 顶级域,再下面是 server.com

类似于这样的树形结构

DNS 域名解析的大致流程如下:

  1. 先检查浏览器中的 DNS 缓存,如果浏览器中有对应的记录会直接使用,并完成解析
  2. 如果浏览器没有缓存,那就去查询操作系统的缓存,如果查询到记录就可以直接返回 P 地址,完成解析
  3. 如果操作系统没有 DNS 缓存,就会去查看本地 host 文件,Windows 操作系统下,host 文件一般位于C:Windows System32 drivers etc hosts”,如果 host 文件有记录则直接使用
  4. 如果本地 host 文件没有相应的记录,会请求本地 DNS 服务器,本地 DNS 服务器一般是由本地网络服务商如移动、电信提供。
  5. 如果本地 DNS 服务器没有相应的记录,就会去根域名服务器查询了,目前全球一共有 13 组根域名服务器,为了能更高效完成全球所有域名的解析请求,根域名服务器本身并不会直接去解析域名,而是会把不同的解析请求分配给下面的其他服务器去完成
举个栗子
  • 当我们先要访问www.server.com时本地 DNS 会去问它的根域名服务器,根域名服务器是最高层次的,它不直接用于域名解析,但能指明一条道路根 DNS 收到来自本地 DNS 的请求后,发现后置是 .com,则会让他去访问.com服务器
  • 然后本地DNS会根据指引访问.com服务器,.com服务器会再次指向server.com服务器
  • 最后本地DNS再次更具指引访问server.com服务器,server.com服务器查询后将对应的 IP 地址 X.X.X.X 告诉本地 DNS
  • 本地 DNS 再将 IP 地址返回客户端,客户端和目标建立连接

接下来我们有了目标服务器的地址,就要开始传输

TCP

我们之前对请求进行了HTTP 封装,而HTTP是基于 TCP 协议传输的,所以在这我们先了解下 TCP 协议。

  • 首先,源端口号目标端口号是不可少的,如果没有这两个端口号,数据就不知道应该发给哪个应用。
  • 接下来有包的号,这个是为了解决包乱序的问题。
  • 还有应该有的是确认号,目的是确认发出去对方是否有收到。如果没有收到就应该重新发送,直到送达,这个是为了解决丢包的问题。
  • 接下来还有一些状态位。例如 SYN 是发起一个连接,ACK 是回复,RST 是重新连接,FIN 是结束连接等。TCP 是面向连接的,因而双方要维护连接的状态,这些带状态位的包的发送,会引起双方的状态变更。
  • 还有一个重要的就是窗口大小。TCP 要做流量控制,通信双方各声明一个窗口(缓存大小),标识自己当前能够的处理能力,别发送的太快,撑死我,也别发的太慢,饿死我。
  • 除了做流量控制以外,TCP还会做拥塞控制,对于真正的通路堵车不堵车,它无能为力,唯一能做的就是控制自己,也即控制发送的速度。不能改变世界,就改变自己嘛。

在 HTTP 传输数据之前,首先需要 TCP 建立连接,TCP 连接的建立,通常称为三次握手

  • 一开始,客户端和服务端都处于 CLOSED 状态。先是服务端主动监听某个端口,处于 LISTEN 状态。

  • 然后客户端主动发起连接 SYN,之后处于 SYN-SENT 状态。

  • 服务端收到发起的连接,返回 SYN,并且 ACK 客户端的 SYN,之后处于 SYN-RCVD 状态。

  • 客户端收到服务端发送的 SYN 和 ACK 之后,发送对 SYN 确认的 ACK,之后处于 ESTABLISHED 状态,因为它一发一收成功了。

  • 服务端收到 ACK 的 ACK 之后,处于 ESTABLISHED 状态,因为它也一发一收了。

封装TCP 

 传输层

应用层的数据包会传给传输层,传输层Transport Layer)是为应用层提供网络支持的。

在传输层会有两个传输协议,分别是 TCP 和 UDP。

  • TCP 的全称叫传输控制协议(Transmission Control Protocol),大部分应用使用的正是 TCP 传输层协议,比如 HTTP 应用层协议。TCP 相比 UDP 多了很多特性,比如流量控制、超时重传、拥塞控制等,这些都是为了保证数据包能可靠地传输给对方。
  • UDP 相对来说就很简单,简单到只负责发送数据包,不保证数据包是否能抵达对方,但它实时性相对更好,传输效率也高。

应用需要传输的数据可能会非常大,如果直接传输就不好控制,因此当传输层的数据包大小超过 MSS(TCP 最大报文段长度) ,就要将数据包分块,这样即使中途有一个分块丢失或损坏了,只需要重新发送这一个分块,而不用重新发送整个数据包。在 TCP 协议中,我们把每个分块称为一个 TCP 段TCP Segment)。

当设备作为接收方时,传输层则要负责把数据包传给应用,但是一台设备上可能会有很多应用在接收或者传输数据,因此需要用一个编号将应用区分开来,这个编号就是端口

比如 80 端口通常是 Web 服务器用的,22 端口通常是远程登录服务器用的。而对于浏览器(客户端)中的每个标签栏都是一个独立的进程,操作系统会为这些进程分配临时的端口号。

由于传输层的报文中会携带端口号,因此接收方可以识别出该报文是发送给哪个应用。

IP

TCP 模块在执行连接、收发、断开等各阶段操作时,都需要委托 IP 模块将数据封装成网络包发送给通信对象。

IP 协议格式

在 IP 协议里面需要有源地址 IP 和 目标地址 IP

  • 源地址IP,即是客户端输出的 IP 地址;
  • 目标地址,即通过 DNS 域名解析得到的 Web 服务器 IP。

因为 HTTP 是经过 TCP 传输的,所以在 IP 包头的协议号,要填写为 06(十六进制),表示协议为 TCP。

封装IP报文

网络层 

传输层可能大家刚接触的时候,会认为它负责将数据从一个设备传输到另一个设备,事实上它并不负责。

实际场景中的网络环节是错综复杂的,中间有各种各样的线路和分叉路口,如果一个设备的数据要传输给另一个设备,就需要在各种各样的路径和节点进行选择,而传输层的设计理念是简单、高效、专注,如果传输层还负责这一块功能就有点违背设计原则了。

也就是说,我们不希望传输层协议处理太多的事情,只需要服务好应用即可,让其作为应用间数据传输的媒介,帮助实现应用到应用的通信,而实际的传输功能就交给下一层,也就是网络层Internet Layer)。

网络层最常使用的是 IP 协议(Internet Protocol),IP 协议会将传输层的报文作为数据部分,再加上 IP 包头组装成 IP 报文,如果 IP 报文大小超过 MTU(以太网中一般为 1500 字节)就会再次进行分片,得到一个即将发送到网络的 IP 报文。

数据链路层 

生成了 IP 头部之后,接下来要交给数据链路层(Data Link Layer)在 IP 头部的前面加上 MAC 头部,并封装成数据帧(Data frame)发送到网络上。

IP 头部中的接收方 IP 地址表示网络包的目的地,通过这个地址我们就可以判断要将包发到哪里,但在以太网的世界中,这个思路是行不通的。

什么是以太网呢?电脑上的以太网接口,Wi-Fi接口,以太网交换机、路由器上的千兆,万兆以太网口,还有网线,它们都是以太网的组成部分。以太网就是一种在「局域网」内,把附近的设备连接起来,使它们之间可以进行通讯的技术。

以太网在判断网络包目的地时和 IP 的方式不同,因此必须采用相匹配的方式才能在以太网中将包发往目的地,而 MAC 头部就是干这个用的,所以,在以太网进行通讯要用到 MAC 地址。

MAC 头部是以太网使用的头部,它包含了接收方和发送方的 MAC 地址等信息,我们可以通过 ARP 协议获取对方的 MAC 地址。

所以说,数据链路层主要为网络层提供「链路级别」传输的服务,负责在以太网、WiFi 这样的底层网络上发送原始数据包,工作在网卡这个层次,使用 MAC 地址来标识网络上的设备。

物理层

最后网卡将数据转换为电信号,传输到路由器,通过物理媒介 (比如以太网电缆、Wi-Fi信号) 在网络中传输。

总结

本文通过一个实际引用场景展开分析了一个网络请求时如何在网络传输的

  • 介绍了网络TCP/IP模型
  • 介绍了HTTP协议
  • 介绍了TCP协议
  • 介绍IP协议

如果大家感兴趣的话之后会出具体的HTTP具体细节和TCP三握四挥,TCP如何保证可靠传输,和一些相关的面试题 等网络知识

如果觉得还不错的话,可以点赞收藏加关注哦,十分感谢!!!

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐