运输层——计算机网络笔记

@Yi-Xing 2020-11-14 0 评论 0 浏览

计算机网络

一、运输层的功能

运输层为应用进程之间提供端到端的逻辑通信（网络层是为主机之间提供逻辑通信）两个对等运输实体在通信时传送的数据单位叫作运输协议数据单元 TPDU。运输层还要对收到的报文进行差错检测，运输层提供面向连接和无连接的服务。

1、运输层协议和网络层协议的主要区别

运输层为相互通信的应用进程提供了逻辑通信。

网络层为主机之间提供逻辑通信，而运输层为应用进程之间提供端到端的逻辑通信。运输层会对收到的报文进行差错检测，网络层只对 IP 数据报的首部进行差错检测。

2、运输层的复用和分用功能

3、运输层的两个主要协议

TCP/IP 的运输层有两个不同的协议：

用户数据报协议 UDP：UDP 传送的协议数据单元是 UDP 报文或用户数据报；
传输控制协议 TCP：TCP 传送的协议数据单元是 TCP 报文段。

5、运输层的端口

在协议栈层间的抽象的协议端口是软件端口，软件端口是应用层的各种协议进程与运输实体进行层间交互的一种地址。端口用一个 16 位端口号进行标志，端口号只具有本地意义。即端口号只是为了标志本计算机应用层中的各进程，在因特网中不同计算机的相同端口号是没有联系的。

（1）服务器端使用的端口号

服务器端使用的端口号分为两类：

熟悉知端口号（系统端口号）：数值为 0~1023，IANA 把这些端口号指派给了 TCP/IP 最重要的一些应用程序，下表就是常用的熟知端口号；
登记端口号：数值为 1024~49151。

| 应用程序 | FTP | TELNET | SMTP | DNS | TFTP | HTTP | SNMP | SNMP(trap) | HTTPS |
| - | :-: | :-: | :-: | :-: | :-: | :-: | :-: | :-: | :-: |
| 熟知端口号 | 21 | 23 | 25 | 53 | 69 | 80 | 161 | 162 | 443 |

（2）客户端使用的端口号

客户端使用的端口号，数值为 49152~65535。由于这类端口号仅在客户进程运行时才动态选择，因此又叫做短暂端口号。

二、用户数据报协议 UDP

1、UDP 的主要特点

UDP 是无连接的，即发送数据之前不需要建立连接。
UDP 使用尽最大努力交付，即不保证可靠交付，同时也不使用拥塞控制。
UDP 是面向报文的。UDP 没有拥塞控制，很适合多媒体通信的要求。
UDP 支持一对一、一对多、多对一和多对多的交互通信。
UDP 的首部开销小，只有 8 个字节。

2、UDP 的首部格式

用户数据报 UDP 有两个字段：数据字段和首部字段。首部字段很简单，只有 8 个字节，由四个字段组成，每个字段的长度都是两个字节。各字段有：

源端口：在需要对方回信时选用。不需要时可用全 0；
目的端口：这在终点交付报文时必须使用；
长度：用户数据报的长度，最小值是 8；
检验和：检测 UDP 用户数据报在传输中是否有错。有错就丢弃。

3、计算 UDP 检验和的例子

在计算检验和时，临时把“伪首部”和 UDP 用户数据报连接在一起。伪首部仅仅是为了计算检验和。

三、传输控制协议 TCP

1、TCP 的概述

（1）TCP 的特点

TCP 是面向连接的运输层协议。
每一条 TCP 连接只能有两个端点，每一条 TCP 连接只能是点对点的（一对一）。
TCP 提供可靠交付的服务，通过 TCP 连接传送的数据，无差错、不丢失、不重复，并且按序到达。
TCP 提供全双工通信。
面向字节流，TCP 中的“流”指的是流入到进程或从进程流出的字节序列。

（2）TCP 的连接

TCP 把连接作为最基本的抽象，每一条 TCP 连接有两个端点。TCP 连接的端点不是主机、不是主机的 IP 地址、不是应用进程、也不是运输层的协议端口、而是套接字（socket）或插口。端口号拼接 IP 地址即构成了套接字，套接字 socket =（IP地址: 端口号）。每一条 TCP 连接唯一地被通信两端的两个端点（即两个套接字）所确定。即：TCP 连接 ::= {socket1, socket2} = {(IP1: port1), (IP2: port2)}

2、可靠传输的工作原理

TCP 可靠传输的工作原理是依靠停止等待协议。在发送完一个分组后，必须暂时保留已发送的分组的副本，分组和确认分组都必须进行编号。超时计时器的重传时间应当比数据在分组传输的平均往返时间更长一些。

（1）可靠通信的实现

使用上述的确认和重传机制，我们就可以在不可靠的传输网络上实现可靠的通信。这种可靠传输协议常称为自动重传请求 ARQ（Automatic Repeat reQuest）。 ARQ 表明重传的请求是自动进行的，接收方不需要请求发送方重传某个出错的分组。

3、信道利用率

停止等待协议的优点是简单，但缺点是信道利用率太低。信道利用率 $U=TD/(TD+RTT+TA)$。

（1）流水线传输

发送方可连续发送多个分组，不必每发完一个分组就停顿下来等待对方的确认。由于信道上一直有数据不间断地传送，这种传输方式可获得很高的信道利用率。

（2）连续 ARQ 协议

下图表示发送方维护的发送窗口，它的意义是：位于发生窗口内的 5 个分组都可连续发送出去，而不需要等待对方的确认，从而提高信道利用率。连续 ARQ 协议规定，发送方每收到一个确认，就把发送窗口向前滑动一个分组的位置。

接收方一般采用累积确认的方式。接收方不必对收到的分组逐个发送确认，而是在收到几个分组后，对按序到达的最后一个分组发送确认。

优点是：容易实现，即使确认丢失也不必重传。
缺点是：不能向发送方反映出接收方已经正确收到的所有分组的信息。

4、TCP 报文段的首部格式

TCP 首部各字段的意义如下：

源端口和目的端口：各占 2 字节，分别写入源端口号和目的端口号。
序号：占 4 字节，序号范围是 [0，2^32 -1]。TCP 连接中传送的数据流中的每一个字节都编上一个序号。序号字段的值则指的是本报文段所发送的数据的第一个字节的序号。
确认号：占 4 个字节，是期望收到对方下一个报文段的第一个数据字节的序号。若确认好为 N，则表明：到序号 N-1 为止的所有数据都已正确收到。
数据偏移：占 4 位，它指出 TCP 报文段的数据起始处距离 TCP 报文段的起始处有多远，实际就是 TCP 报文段的首部长度。数据偏移的单位是 32 位字（即 4 字节的字为单位），4 位二进制最大能表示的十进制是 15，因此数据偏移最大值是 60（首部最大长度）。
保留：占 6 位，保留今后使用。
紧急 URG：当 URG=1 时，表明紧急指针字段有效。告诉系统此报文段是否有紧急数据，应尽快传送（相当于高优先级的数据）。
确认 ACK：当 ACK=1 时确认号有效。TCP 规定，在连接建立后所有传送的报文段都必须把 ACK 置 1。
推送 PSH：通信时，有时希望在一端进行一个操作后就立即收到对方的响应，这种情况就可以使用推送（push）操作。接收方收到 PSH=1 的报文段，就尽快地交付接收应用进程，不再等整个缓存都填满了再向上交付。
复位 RST：当 RST=1 时，表明 TCP 连接中出现了严重错误，必须释放连接，然后再重新建立运输连接。
同步 SYN：在连接建立时用来同步序号。当 SYN=1 而 ACK=0 时，表明这是一个连接请求报文段。对方若同意建立连接，则应在响应的报文段中使用 SYN=1 和 ACK=1。因此 SYN=1 就表示这是一个连接请求或连接接收报文。
终止 FIN：用来释放一个连接。当FIN=1 表明此报文段的发送端的数据已发送完毕，并要求释放运输连接。
窗口：占 2 字节。窗口值的范围是 [0，2^16 -1]。窗口指的是发送本报文段的一方的接收窗口（不是发送窗口）。窗口值告诉对方，从本报文段首部的确认号算起，接收方目前允许对方发送的数据量（以字节为单位）。窗口值作为接收方让发送方设置其发送窗口的依据。
检验和：占 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时，要在 TCP 报文段的前面加上 12 字节的伪首部，把伪首部第 4 个字段的 17 改成 6（因为 TCP 的协议号是 6），把第 5 字段的 UDP 长度改成 TCP 长度。接收方收到此报文段后，扔要加上这个伪首部来计算检验和。
紧急指针：占 2 字节。紧急指针只有在 URG=1 时才有意义，指出本报文段中紧急数据的字节数（紧急数据结束后就是普通数据）。
选项：长度可变，最长可达 40 字节。TCP 最初只规定了一种选项：最大报文段长度 MSS，MSS 是每一个 TCP 报文段中的数据字段的最大长度。

其他选项

窗口扩大选项：占 3 字节，其中有一个字节表示移位值 S。新的窗口值等于TCP 首部中的窗口位数增大到(16 + S)，相当于把窗口值向左移动 S 位后获得实际的窗口大小。
时间戳选项：占10 字节，其中最主要的字段时间戳值字段（4 字节）和时间戳回送回答字段（4 字节）。
选择确认选项 SACK：报告收到的不连续的字节块的边界（详细见下）。

5、TCP 可靠传输的实现

TCP 连接的每一端都必须设有两个窗口，一个发送窗口和一个接收窗口；
TCP 的可靠传输机制用字节的序号进行控制；
TCP 两端的四个窗口经常处于动态变化之中；
TCP连接的往返时间 RTT 也不是固定不变的，需要使用特定的算法估算较为合理的重传时间。

（1）发送缓存用来暂时存放

发送应用程序传送到发送方 TCP 准备发送的数据；
TCP 已发送但尚未收到确认的数据。

（2）接收缓存用来暂时存放

按序到达的、但尚未被接收应用程序读取的数据；
未按序到达的数据。

（3）以字节为单位的滑动窗口

（4）超时重传时间的选择

TCP 每发送一个报文段，就对这个报文段设置一次计时器。只要计时器设置的重传时间到但还没有收到确认，就要重传这一报文段。

TCP 采用了一种自适应算法，它记录一个报文段发出的时间，以及收到相应确认的时间。这两个时间差就是报文段的往返时间 RTT。TCP 保留了 RTT 的一个加权平均往返时间 RTTs（平滑的往返时间）。 $新的 RTTs=(1 - a) * (旧的 RTTs) + a * (新的 RTT 样本)$。RFC6298 推荐的 a 值为1/8。

超时计时器设置的超时重传时间 RTO 应略大于上面得出的加权平均往返时间 RTTs。

（5）选择确认 SACK

如果接收方收到的报文段无差错，只是未按序号，中间还缺少一些序号的数据。接收方该如何告诉发送方，才能让发送方只传送缺少的数据，而不重传已经正确到达接收方的数据？如果只使用确认号是无法实现的，但加上选择确认 SACK 便可以实现。

当接收方收到了以下格式的数据时，序号 1001~1500 和 3001~3500 的数据没有收到。可以看出前后字节不连续的每一个字节块都有两个边界：第一个字节块的边界 1501~3001 ，也就是说，左边界指出字节块的第一个字节序号，但右边界减 1 才是字节块中的最后一个序号。同理，第二个字节块的边界 3501~4501。

RFC 2018 规定，如果要使用选择确认 SACK，那么在建立 TCP 连接时，就要在 TCP 的选项中加上“允许 SACK”的选项，而双方必须都事先商定好。如果使用选择确认，那么原来首部中的“确认号字段”的用法仍然不变。只是以后在 TCP 报文段的首部中都增加了 SACK 选项，以便报告收到的不连续的字节块的边界。

由于首部选项的长度最多只有 40 字节，而指明一个边界就要用掉 4 字节（因为序号有 32 位，需要使用 4 个字节表示），因此在选项中最多只能指明 4 个字节块的边界信息（32 个字节）。另外还需要两个字节，一个字节指明是 SACK 选项，另一个字节指明这个选项占多少字节。五个字节块至少需要 42 个字节，超过了选项长度的 40 字节的上限。

6、TCP的流量控制

一般说来，我们总是希望数据传输得更快一些。但如果发送方把数据发送得过快，接收方就可能来不及接收，这就会造成数据的丢失。流量控制就是让发送方的发送速率不要太快，既要让接收方来得及接收，也不要使网络发生拥塞。利用滑动窗口机制可以很方便地在 TCP 连接上实现流量控制。

（1）利用可变窗口进行流量控制举例

现在我们考虑一种情况，上图中 B 向 A 发送了零窗口的报文段后不久，B 的接收缓存又有了一些存储空间。于是 B 想 A 发送了 rwnd=400 的报文段。然而这个报文段丢失了，那么 A 一直在等待 B 发送的非零窗口的通知，而 B 也一直等待 A 发送的数据。如果没有其他措施，这种相互等待的死锁局面将一直延续下去。

为了解决这个问题，TCP 为每一个连接设有一个持续计时器。只要 TCP 连接的一方收到对方的零窗口通知，就启动持续计时器。若持续计时器设置的时间到期，就发送一个零窗口探测报文段，而对方就在确认这个探测报文段时给出了现在的窗口值。若窗口仍然是零，则收到这个报文段的一方就重新设置持续计时器。若窗口不是零，则死锁的僵局就可以打破了。

7、TCP 的拥塞控制

在某段时间，若对网络中某一资源的需求超过了该资源所能提供的可用部分，网络的性能就要变坏，这种情况就叫做拥塞。即：对资源需求的总和 > 可用资源。

若网络中有许多资源同时产生拥塞，网络的性能就会明显变坏，整个网络的吞吐量将随输入负荷的增大而下降。拥塞控制是一个全局性的过程，涉及到所有的主机、所有的路由器，以及与降低网络传输性能有关的所有因素。流量控制往往指在给定的发送端和接收端之间的点对点通信量的控制，它所要做的就是抑制发送端发送数据的速率，以便使接收端来得及接收。

拥塞控制所起的作用

下图的横坐标是提供的负载，代表单位时间内输入给网络的分组的数目。纵坐标是吞吐量，代表单位时间内从网络输出的分组数目。

拥塞控制是很难设计的，因为它是一个动态的（而不是静态的）问题。当前网络正朝着高速化的方向发展，这很容易出现缓存不够大而造成分组的丢失。但分组的丢失是网络发生拥塞的征兆而不是原因。在许多情况下，甚至正是拥塞控制本身成为引起网络性能恶化甚至发生死锁的原因。

（1）慢开始和拥塞避免

拥塞控制也叫做基于窗口的拥塞控制。为此，发生方维持一个拥塞窗口（cwnd）的状态变量。拥塞窗口的大小取决于网络的拥塞程度，并且动态地在变化。发送方让自己的发送窗口等于拥塞窗口。

发送方控制拥塞窗口的原则是：

只要网络没有出现拥塞，拥塞窗口就再增大一些，以便把更多的分组发送出去。
只要网络出现拥塞，拥塞窗口就减小一些，以减少注入到网络中的分组数。

慢开始算法的原理

在主机刚刚开始发送报文段时可先设置拥塞窗口 cwnd = 1，即设置为一个最大报文段 MSS 的数值。在每收到一个对新的报文段的确认（重传的不算在内）后，将拥塞窗口加 1，即增加一个 MSS 的数值。用这样的方法逐步增大发送端的拥塞窗口 cwnd，可以使分组注入到网络的速率更加合理。使用慢开始算法后，每经过一个传输轮次，拥塞窗口 cwnd 就加倍。一个传输轮次所经历的时间其实就是往返时间 RTT。 “传输轮次”更加强调：把拥塞窗口 cwnd 所允许发送的报文段都连续发送出去，并收到了对已发送的最后一个字节的确认。例如，拥塞窗口 cwnd = 4，这时的往返时间 RTT 就是发送方连续发送 4 个报文段，并收到这 4 个报文段的确认，总共经历的时间。

拥塞避免算法

拥塞避免算法的思路是让拥塞窗口 cwnd 缓慢地增大，即每经过一个往返时间 RTT 就把发送方的拥塞窗口 cwnd 加 1，而不是加倍，使拥塞窗口 cwnd 按线性规律缓慢增长。

设置慢开始门限状态变量ssthresh

慢开始门限 ssthresh 的用法如下：

当 cwnd < ssthresh 时，使用慢开始算法。
当 cwnd > ssthresh 时，停止使用慢开始算法而改用拥塞避免算法。
当 cwnd = ssthresh 时，既可使用慢开始算法，也可使用拥塞避免算法。

当网络出现拥塞时

无论在慢开始阶段还是在拥塞避免阶段，只要发送方判断网络出现拥塞（其根据就是没有按时收到确认），就要把慢开始门限 ssthresh 设置为出现拥塞时的发送方窗口值的一半（但不能小于2）。然后把拥塞窗口 cwnd 重新设置为 1，执行慢开始算法。这样做的目的就是要迅速减少主机发送到网络中的分组数，使得发生拥塞的路由器有足够时间把队列中积压的分组处理完毕。

慢开始和拥塞避免算法的实现举例

当 TCP 连接进行初始化时，将拥塞窗口置为 1。下图中的窗口单位不使用字节而使用报文段。慢开始门限的初始值设置为 16 个报文段，即 ssthresh = 16。

“拥塞避免”并非指完全能够避免了拥塞。利用以上的措施要完全避免网络拥塞还是不可能的。“拥塞避免”是说在拥塞避免阶段把拥塞窗口控制为按线性规律增长，使网络比较不容易出现拥塞。

（2）快重传和快恢复

快重传算法首先要求接收方每收到一个失序的报文段后就立即发出重复确认。这样做可以让发送方及早知道有报文段没有到达接收方。

当发送端收到连续三个重复的确认时，就执行“乘法减小”算法，把慢开始门限 ssthresh 减半，但拥塞窗口 cwnd 现在不设置为 1，而是设置为慢开始门限 ssthresh 减半后的数值，然后开始执行拥塞避免算法（“加法增大”），使拥塞窗口缓慢地线性增大。

快重传举例

快重传算法首先要求接收方每收到一个失序的报文段后就立即发出重复确认。这样做可以让发送方及早知道有报文段没有到达接收方。发送方只要一连收到三个重复确认就应当立即重传对方尚未收到的报文段。不难看出，快重传并非取消重传计时器，而是在某些情况下可更早地重传丢失的报文段。

快恢复

当发送方知道现在只是丢失了个别的报文段时，不启动慢开始，而是执行快恢复算法。这时，发送方调整门限值 ssthresh=cwnd/2，同时设置拥塞窗口 cwnd=ssthresh，并开始执行拥塞避免算法。

从连续收到三个重复的确认转入拥塞避免

（3）发送窗口的实际上限值

发送方的发送窗口的上限值应当取为接收方窗口和拥塞窗口这两个变量中较小的一个，即应按以下公式确定：发送窗口的上限值 = Min [rwnd, cwnd]。

当 rwnd < cwnd 时，是接收方的接收能力限制发送窗口的最大值。
当 cwnd < rwnd 时，则是网络的拥塞限制发送窗口的最大值。

（4）主动队列管理 AQM

最简单的情况下，路由器的队列通常是按照“先进先出”的规则处理到来的分组。为了避免发生网络中的全局同步现象，1998 年提出了主动队列管理 AQM。所谓“主动”就是不要等到路由器的队列长度已经达到最大值时才不得不丢弃后面到达的分组。可以有不同的时限方法，可以使用随机早期检测 RED。

8、TCP 的连接管理

TCP 运输连接的建立和释放是每一次面向连接的通信中必不可少的过程。因此，运输连接有三个阶段，即：连接建立、数据传送和连接释放。

TCP 连接的建立都是采用客户服务器方式。主动发起连接建立的应用进程叫做客户，被动等待连接建立的应用进程叫做服务器。

（1）TCP 的连接建立

TCP 建立连接的过程叫做握手，握手需要在客户和服务器之间交换三个 TCP 报文段，即三次握手。

第一次握手

A 的 TCP 向 B 发出连接请求报文段，其首部中的同步位 SYN = 1，并选择序号 seq = x，表明传送数据时的第一个数据字节的序号是 x。

第二次握手

B 的 TCP 收到连接请求报文段后，如果同意，则发确认。B 在确认报文段中应使 SYN = 1，使 ACK = 1，其确认号ack = x + 1，自己选择的序号 seq = y。

第三次握手

A 收到此报文段后向 B 给出确认，其 ACK = 1，确认号 ack = y + 1。 A 的 TCP 通知上层应用进程，连接已经建立。

B 的 TCP 收到主机 A 的确认后，也通知其上层应用进程：TCP 连接已经建立。

连接建立例子：

（2）TCP 的连接释放

数据传输结束后，通信的双方都可释放连接。现在 A 的应用进程先向其 TCP 发出连接释放报文段，并停止再发送数据，主动关闭 TCP 连接。 A 把连接释放报文段首部的 FIN = 1，其序号 seq = u，等待 B 的确认。

B 发出确认，确认号 ack = u + 1，而这个报文段自己的序号 seq = v。 TCP 服务器进程通知高层应用进程。从 A 到 B 这个方向的连接就要释放了，TCP 连接处于半关闭状态。B 若发送数据，A 仍要接收。

若 B 已经没有要向 A 发送的数据，其应用进程就通知 TCP 释放连接。

A 收到连接释放报文段后，必须发出确认。

（3）三次握手建立和释放 TCP 连接的各状态

建立连接

释放连接

TCP 的有限状态机

TCP 有限状态机的图中每一个方框都是 TCP 可能具有的状态。每个方框中的大写英文字符串是 TCP 标准所使用的 TCP 连接状态名。状态之间的箭头表示可能发生的状态变迁。箭头旁边的字，表明引起这种变迁的原因，或表明发生状态变迁后又出现什么动作。图中有三种不同的箭头。粗实线箭头表示对客户进程的正常变迁。粗虚线箭头表示对服务器进程的正常变迁。另一种细线箭头表示异常变迁。

四、TCP 与 UDP 的区别

UDP 在传送数据之前不需要先建立连接。对方的运输层在收到 UDP 报文后，不需要给出任何确认。虽然 UDP 不提供可靠交付，但在某些情况下 UDP 是一种最有效的工作方式。

TCP 则提供面向连接的服务。TCP 不提供广播或多播服务。由于 TCP 要提供可靠的、面向连接的运输服务，因此不可避免地增加了许多的开销。这不仅使协议数据单元的首部增大很多，还要占用许多的处理机资源。

标题：运输层——计算机网络笔记
作者：Yi-Xing
地址：http://47.94.239.232/articles/2020/11/14/1605361460433.html
博客中若有不恰当的地方，请您一定要告诉我。前路崎岖，望我们可以互相帮助，并肩前行！