TCP虽然是面向字节流的,但TCP传送的数据单元却是报文段。一个TCP报文段分为 首部和数据两部分,而TCP的全部功能都体现在它首部中各字段的作用。因此,只有弄清 TCP首部各字段的作用才能掌握TCP的工作原理。下面就讨论TCP报文段的首部格式。

TCP报文段首部的前20个字节是固定的,后面有4n字节是根据需要而增加的选项是整数)。因此TCP首部的最小长度是20字节。

首部固定部分各字段的意义如下:

(1) 源端口和目的端口各占2个字节,分别写入源端口号和目的端口号。和前面所示的UDP的分用相似,TCP的分用功能也是通过端口实现的。

(2) 序号:占4字节。序号范围是[0,2^32 - 1],共2^32 (即4294967296)个序号。序号增加到2^32 - 1后,下一个序号就又回到0。也就是说,序号使用mod 2^32运算。TCP是面向字节流的。在一个TCP连接中传送的字节流中的每一个字节都按顺序编号。整个要传送的字节流的起始序号必须在连接建立时设置。首部中的序号字段值则指的是本报文段所发送 的数据的第一个字节的序号。例如,一报文段的序号字段值是301,而携带的数据共有100 字节。这就表明:本报文段的数据的第一个字节的序号是301,最后一个字节的序号是400。显然,下一个报文段(如果还有的话)的数据序号应当从401开始,即下一个报文段 的序号字段值应为401。这个字段的名称也叫做“报文段序号”。

(3)确认号:占4字节,是期望收到对方下一个报文段的第一个数据字节的序号。例 如,B正确收到了 A发送过来的一个报文段,其序号字段值是501,而数据长度是200字节 (序号501〜700),这表明B正确收到了 A发送的到序号700为止的数据。因此,B期望收到A的下一个数据序号是701,于是B在发送给A的确认报文段中把确认号置为701。 请注意,现在的确认号不是501,也不是700,而是701。

总之,应当记住:

由于序号字段有32位长,可对4GB (即4千兆字节)的数据进行编号。在一般情况下 可保证当序号重复使用时,旧序号的数据早已通过网络到达终点了。

(4) 数据偏移 占4位,它指出TCP报文段的数据起始处距离TCP报文段的起始处有多远。这个字段实际上是指出TCP报文段的首部长度。由于首部中还有长度不确定的选项字段,因此数据偏移字段是必要的。但应注意,“数据偏移”的单位是32位字(即以4字 节长的字为计算单位)。由于4位二进制数能够表示的最大十进制数字是15,因此数据偏移 的最大值是60字节,这也是TCP首部的最大长度(即选项长度不能超过40字节)。

(5) 保留:占6位,保留为今后使用,但目前应置为0。

下面有6个控制位说明本报文段的性质,它们的意义见下面的(6)〜(11)。

(6) 紧急URG (URGent) 当URG = 1时,表明紧急指针字段有效。它告诉系统此报 文段中有紧急数据,应尽快传送(相当于高优先级的数据),而不要按原来的排队顺序来传 送。例如,己经发送了很长的一个程序要在远地的主机上运行。但后来发现了一些问题,需 要取消该程序的运行。因此用户从键盘发出中断命令(Control + C)。如果不使用紧急数 据,那么这两个字符将存储在接收TCP的缓存末尾。只有在所有的数据被处理完毕后这两 个字符才被交付接收方的应用进程。这样做就浪费了许多时间。

当URG置1时,发送应用进程就告诉发送方的TCP有紧急数据要传送。于是发送方 TCP就把紧急数据插入到本报文段数据的最前面,而在紧急数据后面的数据仍是普通数 据。这时要与首部中紧急指针(Urgent Pointer)字段配合使用。

(7) 确认ACK (ACKnowlegment) 仅当ACK = 1时确认号字段才有效。当ACK = 0 时,确认号无效。TCP规定,在连接建立后所有传送的报文段都必须把ACK置1

(8) 推送PSH (PuSH) 当两个应用进程进行交互式的通信时,有时在一端的应用进程 希望在键入一个命令后立即就能够收到对方的响应。在这种情况下,TCP就可以使用推送 (push)操作。这时,发送方TCP把PSH置1,并立即创建一个报文段发送出去。接收方 TCP收到PSH=1的报文段,就尽快地(即“推送”向前)交付接收应用进程,而不再等到整个缓存都填满了后再向上交付。

虽然应用程序可以选择推送操作,但推送操作还很少使用。

(9) 复位RST (ReSeT) 当RST = 1时,表明TCP连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。RST置1还用来拒绝一个非 法的报文段或拒绝打开一个连接。RST也可称为重建位或重置位。 (10)同步SYN (SYNchronization) 在连接建立时用来同步序号。当SYN = 1而ACK = 0 时,表明这是了个连接请求报文段。对方若同意建立连接,则应在响应的报文段中使SYN = 1 和ACK = 1。因此,SYN置为1就表示这是一个连接请求或连接接受报文。关于连接的建 立和释放,在本章的5.9节还要进行详细讨论。

(11)终止FIN(FINis,意思是“完”、“终”)用来释放一个连接。当FIN = 1时,表 明此报文段的发送方的数据已发送完毕,并要求释放运输连接。

(12)窗口:占2字节。窗口值是[0,216- 1]之间的整数。窗口指的是发送本报文段的 一方的接收窗口(而不是自己的发送窗口)。窗口值告诉对方:从本报文段首部中的确认号算起,接收方目前允许对方发送的数据量。之所以要有这个限制,是因为接收方的数据缓存 空间是有限的。总之,窗口值作为接收方让发送方设置其发送窗口的依据。

例如,设确认号是701,窗口字段是1 000。这就表明,从701号算起,发送此报文段 的一方还有接收1000个字节数据(字节序号是701 ~ 1700)的接收缓存空间。

总之,应当记住:

(13)检验和:占2字节。检验和字段检验的范围包括首部和数据这两部分。和UDP 用户数据报一样,在计算检验和时,要在TCP报文段的前面加上12字节的伪首部。伪首部 的格式与UDP用户数据报的伪首部一样。但应把伪首部第4个字段中的17改为6(TCP的协议号是6),把第5字段中的UDP长度改为TCP长度。接收方收到此报文段后,仍要加上这个伪首部来计算检验和。若使用IPv6,则相应的伪首部也要改变。

(14)紧急指针:占2字节。紧急指针仅在URG = 1时才有意义,它指出本报文段中 的紧急数据的字节数(紧急数据结束后就是普通数据)。因此,紧急指针指出了紧急数据的 末尾在报文段中的位置。当所有紧急数据都处理完时,TCP就告诉应用程序恢复到正常操作。值得注意的是,即使窗口为零时也可发送紧急数据。

(15)选项:长度可变,最长可达40字节。当没有使用“选项”时,TCP的首部长度 是20字节。

TCP最初只规定了一种选项,即最大报文段长度MSS (Maximum Segment Size) [RFC 879]。请注意MSS这个名词的含义。MSS是每一个TCP报文段中的数据字段的最大长度。 数据字段加上TCP首部才等于整个的TCP报文段。所以MSS并不是整个TCP报文段的最大长度,而是“TCP报文段长度减去TCP首部长度”。

为什么要规定一个最大报文段长度MSS呢?这并不是考虑接收方的接收缓存可能放不 下TCP报文段中的数据。实际上,MSS与接收窗口值没有关系。我们知道,TCP报文段的数据部分,至少要加上40字节的首部(TCP首部20字节和IP首部20字节,这里都还没有 考虑首部中的选项部分),才能组装成一个IP数据报。若选择较小的MSS长度,网络的利用率就降低。设想在极端的情况下,当TCP报文段只含有1字节的数据时,在IP层传输的 数据报的开销至少有40字节(包括TCP报文段的首部和IP数据报的首部)。这样,对网络的 利用率就不会超过1/41。到了数据链路层还要加上一些开销。但反过来,若TCP报文段非常长,那么在IP层传输时就有可能要分解成多个短数据报片。在终点要把收到的各个短数 据报片装配成原来的TCP报文段。当传输出错时还要进行重传。这些也都会使开销增大。

因此,MSS应尽可能大些,只要在IP层传输时不需要再分片就行。由于IP数据报所 经历的路径是动态变化的,因此在这条路径上确定的不需要分片的MSS,如果改走另一条 路径就可能需要进行分片。因此最佳的MSS是很难确定的。在连接建立的过程中,双方都 把自己能够支持的MSS写入这一字段,以后就按照这个数值传送数据,两个传送方向可以 有不同的MSS值气若主机未填写这一项,则MSS的默认值是536字节长。因此,所有在因特网上的主机都应能接受的报文段长度是536+ 20 (固定首部长度)=556字节。

随着因特网的发展,又陆续增加了几个选项。如窗口扩大选项、时间戳选项等[RFC 1323]。以后又增加了有关选择确认(SACK)选项[RFC 2018]。

窗口扩大选项是为了扩大窗口。我们知道,TCP首部中窗口字段长度是16位,因此最 大的窗口大小为64 K字节(见下一节)。虽然这对早期的网络是足够用的,但对于包含卫星 信道的网络®,传播时延和带宽都很大,要获得高吞吐率需要更大的窗口大小。

窗口扩大选项占3字节,其中有一个字节表示移位值S。新的窗口值等于TCP首部中 的窗口位数从16增大到(16 + S)。移位值允许使用的最大值是14,相当于窗口最大值增大 到 2^(16 + 14) - 1 =2^30 - 1。

窗口扩大选项可以在双方初始建立TCP连接时进行协商。如果连接的某一端实现了窗 口扩大,当它不再需要扩大其窗口时,可发送S = 0的选项,使窗口大小回到16。

时间戳选项占10字节,其中最主要的字段时间戳值字段(4字节)和时间戳回送回答 字段(4字节)。时间戳选项有以下两个功能:

第一,用来计算往返时间RTT。发送方在发送报文段时把当前时钟 的时间值放入时间戳字段,接收方在确认该报文段时把时间戳字段值复制到时间戳回送回答 字段。因此,发送方在收到确认报文后,可以准确地计算出RTT来。

第二,用于处理TCP序号超过2^32的情况,这又称为防止序号绕回PAWS (Protect Against Wrapped Sequence numbers)。我们知道,序号只有32位,而每增加232个序号就会 重复使用原来用过的序号。当使用高速网络时,在一次TCP连接的数据传送中序号很可能 会被重复使用。例如,若用1 Gb/s的速率发送报文段,则不到35秒钟数据字节的序号就会 重复。为了使接收方能够把新的报文段和迟到很久的报文段区分开,可以在报文段中加上这种时间戳。

我们用一个例子来说明选择确认(Selective ACK)的工作原理。TCP的接收方在接收对方 发送过来的数据字节流的序号不连续,结果就形成了一些不连续的字节块(如图5-21所 示)。可以看出,序号1 ~ 1000收到了,但序号1001 ~ 1500没有收到。接下来的字节流又 收到了,可是又缺少了 3001〜3500。再后面从序号4501起又没有收到。也就是说,接收方 收到了和前面的字节流不连续的两个字节块。如果这些字节的序号都在接收窗口之内,那么 接收方就先收下这些数据,但要把这些信息准确地告诉发送方,使发送方不要再重复发送这些已收到的数据。

从图可看出,和前后字节不连续的每一个字节块都有两个边界:左边界和右边界。因此在图中用四个指针标记这些边界。请注意,第一个字节块的左边界L1 = 1501,但 右边界R1= 3001而不是3000。这就是说,左边界指出字节块的第一个字节的序号,但右边 界减1才是字节块中的最后一个序号。同理,第二个字节块的左边界L2 = 3501,而右边界 R2 = 4501。

我们知道,TCP的首部没有哪个字段能够提供上述这些字节块的边界信息。如果要使用选择确认SACK,那么在建立TCP连接时,就要在TCP首部的选项中加 上“允许SACK”的选项,而双方必须都事先商定好。如果使用选择确认,那么原来首部中的“确认号字段”的用法仍然不变。只是以后在TCP报文段的首部中都增加了SACK选 项,以便报告收到的不连续的字节块的边界。由于首部选项的长度最多只有40字节,而指明一个边界就要用掉4字节(因为序号有32位,需要使用4个字节表示),因此在选项中最多只能指明4个字节块的边界信息。这是因为4个字节块共有8个边界,因而需要用32个 字节来描述。另外还需要两个字节。一个字节用来指明是SACK选项,另一个字节是指明这个选项要占用多少字节。如果要报告五个字节块的边界信息,那么至少需要42个字节。

然而,SACK文档并没有指明发送方应当怎样响应SACK。因此大多数的实现还是重传所有未被确认的数据块。