一图看完本文

一、计算机网络体系结构分层【Java自学网（javazx.com）推荐】

计算机网络体系结构分层

不难看出，TCP/IP 与 OSI 在分层模组上稍有区别。OSI 参考模型注重“通讯协议必要的功能是什么”，而 TCP/IP 则更强调“在计算机上实现协议应该开发哪种程式”。

二、 TCP/IP 基础

1. TCP/IP 的具体含义

从字面意义上讲，有人可能会认为 TCP/IP 是指 TCP 和 IP 两种协议。实际生活当中有时也确实就是指这两种协议。然而在很多情况下，它只是利用 IP 进行通讯时所必须用到的协议群的统称。具体来说，IP 或 ICMP、TCP 或 UDP、TELNET 或 FTP、以及 HTTP 等都属于 TCP/IP 协议。他们与 TCP 或 IP 的关系紧密，是互联网必不可少的组成部分。TCP/IP 一词泛指这些协议，因此，有时也称 TCP/IP 为网际协议群。

互联网进行通讯时，需要相应的网络协议，TCP/IP 原本就是为使用互联网而开发制定的协议族。因此，互联网的协议就是 TCP/IP，TCP/IP 就是互联网的协议。

网际协议群

2. 资料包

包、帧、资料包、段、讯息

以上五个术语都用来表述资料的单位，大致区分如下：

包可以说是全能性术语；帧用于表示资料链路层中包的单位；资料包是 IP 和 UDP 等网络层以上的分层中包的单位；段则表示 TCP 资料流中的资讯；讯息是指应用协议中资料的单位。每个分层中，都会对所传送的资料附加一个首部，在这个首部中包含了该层必要的资讯，如传送的目标地址以及协议相关资讯。通常，为协议提供的资讯为包首部，所要传送的内容为资料。在下一层的角度看，从上一层收到的包全部都被认为是本层的资料。

资料包首部

网络中传输的资料包由两部分组成：一部分是协议所要用到的首部，另一部分是上一层传过来的资料。首部的结构由协议的具体规范详细定义。在资料包的首部，明确标明了协议应该如何读取资料。反过来说，看到首部，也就能够了解该协议必要的资讯以及所要处理的资料。包首部就像协议的脸。

3. 资料处理流程

下图以使用者 a 向用户 b 传送邮件为例子：

资料处理流程

① 应用程序处理首先应用程序会进行编码处理，这些编码相当于 OSI 的表示层功能；编码转化后，邮件不一定马上被发送出去，这种何时建立通讯连线何时传送资料的管理功能，相当于 OSI 的会话层功能。② TCP 模组的处理TCP 根据应用的指示，负责建立连线、传送资料以及断开连线。TCP 提供将应用层发来的资料顺利传送至对端的可靠传输。为了实现这一功能，需要在应用层资料的前端附加一个 TCP 首部。③ IP 模组的处理IP 将 TCP 传过来的 TCP 首部和 TCP 资料合起来当做自己的资料，并在 TCP 首部的前端加上自己的 IP 首部。IP 包生成后，参考路由控制表决定接受此 IP 包的路由或主机。④ 网络界面（以太网驱动）的处理从 IP 传过来的 IP 包对于以太网来说就是资料。给这些资料附加上以太网首部并进行传送处理，生成的以太网资料包将通过物理层传输给接收端。⑤ 网络界面（以太网驱动）的处理主机收到以太网包后，首先从以太网包首部找到 MAC 地址判断是否为传送给自己的包，若不是则丢弃资料。如果是传送给自己的包，则从以太网包首部中的型别确定资料型别，再传给相应的模组，如 IP、ARP 等。这里的例子则是 IP 。⑥ IP 模组的处理IP 模组接收到资料后也做类似的处理。从包首部中判断此 IP 地址是否与自己的 IP 地址匹配，如果匹配则根据首部的协议型别将资料传送给对应的模组，如 TCP、UDP。这里的例子则是 TCP。另外吗，对于有路由器的情况，接收端地址往往不是自己的地址，此时，需要借助路由控制表，在调查应该送往的主机或路由器之后再进行转发资料。⑦ TCP 模组的处理在 TCP 模组中，首先会计算一下校验和，判断资料是否被破坏。然后检查是否在按照序号接收资料。最后检查埠号，确定具体的应用程序。资料被完整地接收以后，会传给由埠号识别的应用程序。⑧ 应用程序的处理接收端应用程序会直接接收发送端传送的资料。通过解析资料，展示相应的内容。

三、传输层中的 TCP 和 UDP

TCP/IP 中有两个具有代表性的传输层协议，分别是 TCP 和 UDP。

TCP 是面向连线的、可靠的流协议。流就是指不间断的资料结构，当应用程序采用 TCP 传送讯息时，虽然可以保证传送的顺序，但还是犹如没有任何间隔的资料流传送给接收端。TCP 为提供可靠性传输，实行“顺序控制”或“重发控制”机制。此外还具备“流控制（流量控制）”、“拥塞控制”、提高网络利用率等众多功能。UDP 是不具有可靠性的资料报协议。细微的处理它会交给上层的应用去完成。在 UDP 的情况下，虽然可以确保传送讯息的大小，却不能保证讯息一定会到达。因此，应用有时会根据自己的需要进行重发处理。TCP 和 UDP 的优缺点无法简单地、绝对地去做比较：TCP 用于在传输层有必要实现可靠传输的情况；而在一方面，UDP 主要用于那些对高速传输和实时性有较高要求的通讯或广播通讯。TCP 和 UDP 应该根据应用的目的按需使用。1. 埠号

资料链路和 IP 中的地址，分别指的是 MAC 地址和 IP 地址。前者用来识别同一链路中不同的计算机，后者用来识别 TCP/IP 网络中互连的主机和路由器。在传输层也有这种类似于地址的概念，那就是埠号。埠号用来识别同一台计算机中进行通讯的不同应用程序。因此，它也被称为程式地址。

1.1 根据埠号识别应用

一台计算机上同时可以执行多个程式。传输层协议正是利用这些埠号识别本机中正在进行通讯的应用程序，并准确地将资料传输。

通过埠号识别应用

1.2 通过 IP 地址、埠号、协议号进行通讯识别

仅凭目标埠号识别某一个通讯是远远不够的。

通过埠号、IP地址、协议号进行通讯识别

① 和② 的通讯是在两台计算机上进行的。它们的目标埠号相同，都是80。这里可以根据源埠号加以区分。③ 和 ① 的目标埠号和源埠号完全相同，但它们各自的源 IP 地址不同。此外，当 IP 地址和埠号全都一样时，我们还可以通过协议号来区分（TCP 和 UDP）。1.3 埠号的确定

标准既定的埠号：这种方法也叫静态方法。它是指每个应用程序都有其指定的埠号。但并不是说可以随意使用任何一个埠号。例如 HTTP、FTP、TELNET 等广为使用的应用协议中所使用的埠号就是固定的。这些埠号被称为知名埠号，分布在 0~1023 之间；除知名埠号之外，还有一些埠号被正式注册，它们分布在 1024~49151 之间，不过这些埠号可用于任何通讯用途。时序分配法：服务器有必要确定监听埠号，但是接受服务的客户端没必要确定埠号。在这种方法下，客户端应用程序完全可以不用自己设定埠号，而全权交给操作系统进行分配。动态分配的埠号范围在 49152~65535 之间。1.4 埠号与协议

埠号由其使用的传输层协议决定。因此，不同的传输层协议可以使用相同的埠号。此外，那些知名埠号与传输层协议并无关系。只要埠一致都将分配同一种应用程序进行处理。2. UDP

UDP 不提供复杂的控制机制，利用 IP 提供面向无连线的通讯服务。并且它是将应用程序发来的资料在收到的那一刻，立即按照原样传送到网络上的一种机制。即使是出现网络拥堵的情况，UDP 也无法进行流量控制等避免网络拥塞行为。此外，传输途中出现丢包，UDP 也不负责重发。甚至当包的到达顺序出现乱序时也没有纠正的功能。如果需要以上的细节控制，不得不交由采用 UDP 的应用程序去处理。UDP 常用于一下几个方面：1.包总量较少的通讯（DNS、SNMP等）；2.视讯、音讯等多媒体通讯（即时通讯）；3.限定于 LAN 等特定网络中的应用通讯；4.广播通讯（广播、多播）。3. TCP

TCP 与 UDP 的区别相当大。它充分地实现了资料传输时各种控制功能，可以进行丢包时的重发控制，还可以对次序乱掉的分包进行顺序控制。而这些在 UDP 中都没有。此外，TCP 作为一种面向有连线的协议，只有在确认通讯对端存在时才会传送资料，从而可以控制通讯流量的浪费。根据 TCP 的这些机制，在 IP 这种无连线的网络上也能够实现高可靠性的通讯（主要通过检验和、序列号、确认应答、重发控制、连线管理以及视窗控制等机制实现）。3.1 三次握手（重点）

TCP 提供面向有连线的通讯传输。面向有连线是指在资料通讯开始之前先做好两端之间的准备工作。所谓三次握手是指建立一个 TCP 连线时需要客户端和服务器端总共传送三个包以确认连线的建立。在socket程式设计中，这一过程由客户端执行connect来触发。下面来看看三次握手的流程图：

三次握手

第一次握手：客户端将标志位SYN置为1，随机产生一个值seq=J，并将该资料包传送给服务器端，客户端进入SYN_SENT状态，等待服务器端确认。第二次握手：服务器端收到资料包后由标志位SYN=1知道客户端请求建立连线，服务器端将标志位SYN和ACK都置为1，ack=J+1，随机产生一个值seq=K，并将该资料包传送给客户端以确认连线请求，服务器端进入SYN_RCVD状态。第三次握手：客户端收到确认后，检查ack是否为J+1，ACK是否为1，如果正确则将标志位ACK置为1，ack=K+1，并将该资料包传送给服务器端，服务器端检查ack是否为K+1，ACK是否为1，如果正确则连线建立成功，客户端和服务器端进入ESTABLISHED状态，完成三次握手，随后客户端与服务器端之间可以开始传输资料了。3.2 四次挥手（重点）

四次挥手即终止TCP连线，就是指断开一个TCP连线时，需要客户端和服务端总共传送4个包以确认连线的断开。在socket程式设计中，这一过程由客户端或服务端任一方执行close来触发。由于TCP连线是全双工的，因此，每个方向都必须要单独进行关闭，这一原则是当一方完成资料传送任务后，传送一个FIN来终止这一方向的连线，收到一个FIN只是意味着这一方向上没有资料流动了，即不会再收到资料了，但是在这个TCP连线上仍然能够传送资料，直到这一方向也传送了FIN。首先进行关闭的一方将执行主动关闭，而另一方则执行被动关闭。下面来看看四次挥手的流程图：

四次挥手

中断连线端可以是客户端，也可以是服务器端。第一次挥手：客户端传送一个FIN=M，用来关闭客户端到服务器端的资料传送，客户端进入FIN_WAIT_1状态。意思是说"我客户端没有资料要发给你了"，但是如果你服务器端还有资料没有传送完成，则不必急着关闭连线，可以继续传送资料。第二次挥手：服务器端收到FIN后，先发送ack=M+1，告诉客户端，你的请求我收到了，但是我还没准备好，请继续你等我的讯息。这个时候客户端就进入FIN_WAIT_2 状态，继续等待服务器端的FIN报文。第三次挥手：当服务器端确定资料已传送完成，则向客户端传送FIN=N报文，告诉客户端，好了，我这边资料发完了，准备好关闭连线了。服务器端进入LAST_ACK状态。第四次挥手：客户端收到FIN=N报文后，就知道可以关闭连线了，但是他还是不相信网络，怕服务器端不知道要关闭，所以传送ack=N+1后进入TIME_WAIT状态，如果Server端没有收到ACK则可以重传。服务器端收到ACK后，就知道可以断开连线了。客户端等待了2MSL后依然没有收到回复，则证明服务器端已正常关闭，那好，我客户端也可以关闭连线了。最终完成了四次握手。上面是一方主动关闭，另一方被动关闭的情况，实际中还会出现同时发起主动关闭的情况，

具体流程如下图：

同时挥手

3.3 通过序列号与确认应答提高可靠性

在 TCP 中，当传送端的资料到达接收主机时，接收端主机会返回一个已收到讯息的通知。这个讯息叫做确认应答（ACK）。当传送端将资料发出之后会等待对端的确认应答。如果有确认应答，说明资料已经成功到达对端。反之，则资料丢失的可能性很大。在一定时间内没有等待到确认应答，传送端就可以认为资料已经丢失，并进行重发。由此，即使产生了丢包，仍然能够保证资料能够到达对端，实现可靠传输。未收到确认应答并不意味着资料一定丢失。也有可能是资料对方已经收到，只是返回的确认应答在途中丢失。这种情况也会导致传送端误以为资料没有到达目的地而重发资料。此外，也有可能因为一些其他原因导致确认应答延迟到达，在源主机重发资料以后才到达的情况也屡见不鲜。此时，源主机只要按照机制重发资料即可。对于目标主机来说，反复收到相同的资料是不可取的。为了对上层应用提供可靠的传输，目标主机必须放弃重复的资料包。为此我们引入了序列号。序列号是按照顺序给传送资料的每一个字节（8位字节）都标上号码的编号。接收端查询接收资料 TCP 首部中的序列号和资料的长度，将自己下一步应该接收的序列号作为确认应答返送回去。通过序列号和确认应答号，TCP 能够识别是否已经接收资料，又能够判断是否需要接收，从而实现可靠传输。

序列号和确认应答

3.4 重发超时的确定

重发超时是指在重发资料之前，等待确认应答到来的那个特定时间间隔。如果超过这个时间仍未收到确认应答，传送端将进行资料重发。最理想的是，找到一个最小时间，它能保证“确认应答一定能在这个时间内返回”。TCP 要求不论处在何种网络环境下都要提供高效能通讯，并且无论网络拥堵情况发生何种变化，都必须保持这一特性。为此，它在每次发包时都会计算往返时间及其偏差。将这个往返时间和偏差时间相加，重发超时的时间就是比这个总和要稍大一点的值。在 BSD 的 Unix 以及 Windows 系统中，超时都以0.5秒为单位进行控制，因此重发超时都是0.5秒的整数倍。不过，最初其重发超时的预设值一般设定为6秒左右。资料被重发之后若还是收不到确认应答，则进行再次传送。此时，等待确认应答的时间将会以2倍、4倍的指数函式延长。此外，资料也不会被无限、反复地重发。达到一定重发次数之后，如果仍没有任何确认应答返回，就会判断为网络或对端主机发生了异常，强制关闭连线。并且通知应用通讯异常强行终止。3.5 以段为单位传送资料

在建立 TCP 连线的同时，也可以确定传送资料包的单位，我们也可以称其为“最大讯息长度”（MSS）。最理想的情况是，最大讯息长度正好是 IP 中不会被分片处理的最大资料长度。TCP 在传送大量资料时，是以 MSS 的大小将资料进行分割传送。进行重发时也是以 MSS 为单位。MSS 在三次握手的时候，在两端主机之间被计算得出。两端的主机在发出建立连线的请求时，会在 TCP 首部中写入 MSS 选项，告诉对方自己的界面能够适应的 MSS 的大小。然后会在两者之间选择一个较小的值投入使用。3.6 利用视窗控制提高速度

TCP 以1个段为单位，每传送一个段进行一次确认应答的处理。这样的传输方式有一个缺点，就是包的往返时间越长通讯效能就越低。为解决这个问题，TCP 引入了视窗这个概念。确认应答不再是以每个分段，而是以更大的单位进行确认，转发时间将会被大幅地缩短。也就是说，传送端主机，在传送了一个段以后不必要一直等待确认应答，而是继续传送。如下图所示：

视窗控制视窗大小就是指无需等待确认应答而可以继续传送资料的最大值。上图中视窗大小为4个段。这个机制实现了使用大量的缓冲区，通过对多个段同时进行确认应答的功能。3.7 滑动视窗控制

滑动视窗

上图中的视窗内的资料即便没有收到确认应答也可以被发送出去。不过，在整个视窗的确认应答没有到达之前，如果其中部分资料出现丢包，那么传送端仍然要负责重传。为此，传送端主机需要设定快取保留这些待被重传的资料，直到收到他们的确认应答。在滑动视窗以外的部分包括未传送的资料以及已经确认对端已收到的资料。当资料发出后若如期收到确认应答就可以不用再进行重发，此时资料就可以从快取区清除。收到确认应答的情况下，将视窗滑动到确认应答中的序列号的位置。这样可以顺序地将多个段同时传送提高通讯效能。这种机制也别称为滑动视窗控制。3.8 视窗控制中的重发控制

在使用视窗控制中，出现丢包一般分为两种情况：

① 确认应答未能返回的情况。在这种情况下，资料已经到达对端，是不需要再进行重发的，如下图：

部分确认应答丢失

② 某个报文段丢失的情况。接收主机如果收到一个自己应该接收的序列号以外的资料时，会针对当前为止收到资料返回确认应答。如下图所示，当某一报文段丢失后，传送端会一直收到序号为1001的确认应答，因此，在视窗比较大，又出现报文段丢失的情况下，同一个序列号的确认应答将会被重复不断地返回。而传送端主机如果连续3次收到同一个确认应答，就会将其对应的资料进行重发。这种机制比之前提到的超时管理更加高效，因此也被称为高速重发控制。

高速重发控制

四、网络层中的 IP 协议

IP（IPv4、IPv6）相当于 OSI 参考模型中的第3层——网络层。网络层的主要作用是“实现终端节点之间的通讯”。这种终端节点之间的通讯也叫“点对点通讯”。网络的下一层——资料链路层的主要作用是在互连同一种资料链路的节点之间进行包传递。而一旦跨越多种资料链路，就需要借助网络层。网络层可以跨越不同的资料链路，即使是在不同的资料链路上也能实现两端节点之间的资料包传输。IP 大致分为三大作用模组，它们是 IP 定址、路由（最终节点为止的转发）以及 IP 分包与组包。1. IP 地址

1.1 IP 地址概述

在计算机通讯中，为了识别通讯对端，必须要有一个类似于地址的识别码进行标识。在资料链路中的 MAC 地址正是用来标识同一个链路中不同计算机的一种识别码。作为网络层的 IP ,也有这种地址资讯，一般叫做 IP 地址。IP 地址用于在“连线到网络中的所有主机中识别出进行通讯的目标地址”。因此，在 TCP/IP 通讯中所有主机或路由器必须设定自己的 IP 地址。不论一台主机与哪种资料链路连线，其 IP 地址的形式都保持不变。IP 地址（IPv4 地址）由32位正整数来表示。IP 地址在计算机内部以二进位制方式被处理。然而，由于我们并不习惯于采用二进位制方式，我们将32位的 IP 地址以每8位为一组，分成4组，每组以 “.” 隔开，再将每组数转换成十进位制数。如下：

1.2 IP 地址由网络和主机两部分标识组成

如下图，网络标识在资料链路的每个段配置不同的值。网络标识必须保证相互连线的每个段的地址不相重复。而相同段内相连的主机必须有相同的网络地址。IP 地址的“主机标识”则不允许在同一个网段内重复出现。由此，可以通过设定网络地址和主机地址，在相互连线的整个网络中保证每台主机的 IP 地址都不会相互重叠。即 IP 地址具有了唯一性。

IP地址的主机标识

如下图，IP 包被转发到途中某个路由器时，正是利用目标 IP 地址的网络标识进行路由。因为即使不看主机标识，只要一见到网络标识就能判断出是否为该网段内的主机。

IP地址的网络标识

1.3 IP 地址的分类

IP 地址分为四个级别，分别为A类、B类、C类、D类。它根据 IP 地址中从第 1 位到第 4 位的位元列对其网络标识和主机标识进行区分。A 类 IP 地址是首位以 “0” 开头的地址。从第 1 位到第 8 位是它的网络标识。用十进位制表示的话，0.0.0.0~127.0.0.0 是 A 类的网络地址。A 类地址的后 24 位相当于主机标识。因此，一个网段内可容纳的主机地址上限为16,777,214个。B 类 IP 地址是前两位 “10” 的地址。从第 1 位到第 16 位是它的网络标识。用十进位制表示的话，128.0.0.0~191.255.0.0 是 B 类的网络地址。B 类地址的后 16 位相当于主机标识。因此，一个网段内可容纳的主机地址上限为65,534个。C 类 IP 地址是前三位为 “110” 的地址。从第 1 位到第 24 位是它的网络标识。用十进位制表示的话，192.0.0.0~223.255.255.0 是 C 类的网络地址。C 类地址的后 8 位相当于主机标识。因此，一个网段内可容纳的主机地址上限为254个。D 类 IP 地址是前四位为 “1110” 的地址。从第 1 位到第 32 位是它的网络标识。用十进位制表示的话，224.0.0.0~239.255.255.255 是 D 类的网络地址。D 类地址没有主机标识，常用于多播。在分配 IP 地址时关于主机标识有一点需要注意。即要用位元位表示主机地址时，不可以全部为 0 或全部为 1。因为全部为 0 只有在表示对应的网络地址或 IP 地址不可以获知的情况下才使用。而全部为 1 的主机通常作为广播地址。因此，在分配过程中，应该去掉这两种情况。这也是为什么 C 类地址每个网段最多只能有 254（ 28 - 2 = 254）个主机地址的原因。1.4 广播地址

广播地址用于在同一个链路中相互连线的主机之间传送资料包。将 IP 地址中的主机地址部分全部设定为 1，就成了广播地址。广播分为本地广播和直接广播两种。在本网络内的广播叫做本地广播；在不同网络之间的广播叫做直接广播。1.5 IP 多播

多播用于将包传送给特定组内的所有主机。由于其直接使用 IP 地址，因此也不存在可靠传输。相比于广播，多播既可以穿透路由器，又可以实现只给那些必要的组传送资料包。请看下图：

IP 多播多播使用 D 类地址。因此，如果从首位开始到第 4 位是 “1110”，就可以认为是多播地址。而剩下的 28 位可以成为多播的组编号。此外，对于多播，所有的主机（路由器以外的主机和终端主机）必须属于 224.0.0.1 的组，所有的路由器必须属于 224.0.0.2 的组。1.6 子网掩码

现在一个 IP 地址的网络标识和主机标识已不再受限于该地址的类别，而是由一个叫做“子网掩码”的识别码通过子网网络地址细分出比 A 类、B 类、C 类更小粒度的网络。这种方式实际上就是将原来 A 类、B 类、C 类等分类中的主机地址部分用作子网地址，可以将原网络分为多个物理网络的一种机制。子网掩码用二进位制方式表示的话，也是一个 32 位的数字。它对应 IP 地址网络标识部分的位全部为 “1”，对应 IP 地址主机标识的部分则全部为 “0”。由此，一个 IP 地址可以不再受限于自己的类别，而是可以用这样的子网掩码自由地定位自己的网络标识长度。当然，子网掩码必须是 IP 地址的首位开始连续的 “1”。对于子网掩码，目前有两种表示方式。第一种是，将 IP 地址与子网掩码的地址分别用两行来表示。以 172.20.100.52 的前 26 位是网络地址的情况为例，如下：

第二种表示方式是，在每个 IP 地址后面追加网络地址的位数用 “/ ” 隔开，如下：

2. 路由

传送资料包时所使用的地址是网络层的地址，即 IP 地址。然而仅仅有 IP 地址还不足以实现将资料包传送到对端目标地址，在资料传送过程中还需要类似于“指明路由器或主机”的资讯，以便真正发往目标地址。储存这种资讯的就是路由控制表。该路由控制表的形成方式有两种：一种是管理员手动设定，另一种是路由器与其他路由器相互交换资讯时自动重新整理。前者也叫做静态路由控制，而后者叫做动态路由控制。IP 协议始终认为路由表是正确的。然后，IP 本身并没有定义制作路由控制表的协议。即 IP 没有制作路由控制表的机制。该表示由一个叫做“路由协议”的协议制作而成。2.1 IP 地址与路由控制

IP 地址的网络地址部分用于进行路由控制。路由控制表中记录着网络地址与下一步应该传送至路由器的地址。在传送 IP 包时，首先要确定 IP 包首部中的目标地址，再从路由控制表中找到与该地址具有相同网络地址的记录，根据该记录将 IP 包转发给相应的下一个路由器。如果路由控制表中存在多条相同网络地址的记录，就选择一个最为吻合的网络地址。路由控制表与 IP 包传送

3. IP 分包与组包

每种资料链路的最大传输单元（MTU）都不尽相同，因为每个不同型别的资料链路的使用目的不同。使用目的不同，可承载的 MTU 也就不同。任何一台主机都有必要对 IP 分片进行相应的处理。分片往往在网络上遇到比较大的报文无法一下子传送出去时才会进行处理。经过分片之后的 IP 资料报在被重组的时候，只能由目标主机进行。路由器虽然做分片但不会进行重组。3.1 路径 MTU 发现

分片机制也有它的不足。如路由器的处理负荷加重之类。因此，只要允许，是不希望由路由器进行 IP 资料包的分片处理的。为了应对分片机制的不足，“路径 MTU 发现” 技术应运而生。路径 MTU 指的是，从传送端主机到接收端主机之间不需要分片是最大 MTU 的大小。即路径中存在的所有资料链路中最小的 MTU 。进行路径 MTU 发现，就可以避免在中途的路由器上进行分片处理，也可以在 TCP 中传送更大的包。4. IPv6

IPv6（IP version 6）是为了根本解决 IPv4 地址耗尽的问题而被标准化的网际协议。IPv4 的地址长度为 4 个 8 位字节，即 32 位元。而 IPv6 的地址长度则是原来的 4 倍，即 128 位元，一般写成 8 个 16 位字节。4.1 IPv6 的特点

IP 得知的扩大与路由控制表的聚合。效能提升。包首部长度采用固定的值（40字节），不再采用首部检验码。简化首部结构，减轻路由器负担。路由器不再做分片处理。支援即插即用功能。即使没有DHCP服务器也可以实现自动分配 IP 地址。采用认证与加密功能。应对伪造 IP 地址的网络安全功能以及防止线路窃听的功能。多播、Mobile IP 成为扩充套件功能。4.2 IPv6 中 IP 地址的标记方法

一般人们将 128 位元 IP 地址以每 16 位元为一组，每组用冒号（“：”）隔开进行标记。而且如果出现连续的 0 时还可以将这些 0 省略，并用两个冒号（“：：”）隔开。但是，一个 IP 地址中只允许出现一次两个连续的冒号。4.3 IPv6 地址的结构

IPv6 类似 IPv4，也是通过 IP 地址的前几位标识 IP 地址的种类。在互联网通讯中，使用一种全域性的单播地址。它是互联网中唯一的一个地址，不需要正式分配 IP 地址。

4.4 全域性单播地址

全域性单播地址是指世界上唯一的一个地址。它是互联网通讯以及各个域内部通讯中最为常用的一个 IPv6 地址。格式如下图所示，现在 IPv6 的网络中所使用的格式为，n = 48，m = 16 以及 128 - n - m = 64。即前 64 位元为网络标识，后 64 位元为主机标识。

全域性单播地址

4.5 链路本地单播地址

链路本地单播地址是指在同一个资料链路内唯一的地址。它用于不经过路由器，在同一个链路中的通讯。通常界面 ID 储存 64 位元版的 MAC 地址。

链路本地单播地址

4.6 唯一本地地址

唯一本地地址是不进行互联网通讯时所用的地址。唯一本地地址虽然不会与互联网连线，但是也会尽可能地随机生成一个唯一的全域性 ID。L 通常被置为 1全域性 ID 的值随机决定子网 ID 是指该域子网地址界面 ID 即为界面的 ID

唯一本地地址

4.7 IPv6 分段处理

IPv6 的分片处理只在作为起点的传送端主机上进行，路由器不参与分片。IPv6 中最小 MTU 为 1280 字节，因此，在嵌入式系统中对于那些有一定系统资源限制的装置来说，不需要进行“路径 MTU 发现”，而是在传送 IP 包时直接以 1280 字节为单位分片送出。4.8 IP 首部（暂略）

5. IP 协议相关技术

IP 旨在让最终目标主机收到资料包，但是在这一过程中仅仅有 IP 是无法实现通讯的。必须还有能够解析主机名称和 MAC 地址的功能，以及资料包在传送过程中异常情况处理的功能。5.1 DNS

我们平常在访问某个网站时不适用 IP 地址，而是用一串由罗马字和点号组成的字串。而一般使用者在使用 TCP/IP 进行通讯时也不使用 IP 地址。能够这样做是因为有了 DNS （Domain Name System）功能的支援。DNS 可以将那串字串自动转换为具体的 IP 地址。这种 DNS 不仅适用于 IPv4，还适用于 IPv6。5.2 ARP

只要确定了 IP 地址，就可以向这个目标地址传送 IP 资料报。然而，在底层资料链路层，进行实际通讯时却有必要了解每个 IP 地址所对应的 MAC 地址。ARP 是一种解决地址问题的协议。以目标 IP 地址为线索，用来定位下一个应该接收资料分包的网络装置对应的 MAC 地址。不过 ARP 只适用于 IPv4，不能用于 IPv6。IPv6 中可以用 ICMPv6 替代 ARP 传送邻居探索讯息。RARP 是将 ARP 反过来，从 MAC 地址定位 IP 地址的一种协议。5.3 ICMP

ICMP 的主要功能包括，确认 IP 包是否成功送达目标地址，通知在传送过程当中 IP 包被废弃的具体原因，改善网络设定等。IPv4 中 ICMP 仅作为一个辅助作用支援 IPv4。也就是说，在 IPv4 时期，即使没有 ICMP，仍然可以实现 IP 通讯。然而，在 IPv6 中，ICMP 的作用被扩大，如果没有 ICMPv6，IPv6 就无法进行正常通讯。5.4 DHCP

如果逐一为每一台主机设定 IP 地址会是非常繁琐的事情。特别是在移动使用膝上型电脑、只能终端以及平板电脑等装置时，每移动到一个新的地方，都要重新设定 IP 地址。于是，为了实现自动设定 IP 地址、统一管理 IP 地址分配，就产生了 DHCP（Dynamic Host Configuration Protocol）协议。有了 DHCP，计算机只要连线到网络，就可以进行 TCP/IP 通讯。也就是说，DHCP 让即插即用变得可能。DHCP 不仅在 IPv4 中，在 IPv6 中也可以使用。5.5 NAT

NAT（Network Address Translator）是用于在本地网络中使用私有地址，在连线互联网时转而使用全域性 IP 地址的技术。除转换 IP 地址外，还出现了可以转换 TCP、UDP 埠号的 NAPT（Network Address Ports Translator）技术，由此可以实现用一个全域性 IP 地址与多个主机的通讯。NAT（NAPT）实际上是为正在面临地址枯竭的 IPv4 而开发的技术。不过，在 IPv6 中为了提高网络安全也在使用 NAT，在 IPv4 和 IPv6 之间的相互通讯当中常常使用 NAT-PT。5.6 IP 隧道

夹着 IPv4 网络的两个 IPv6 网络

如上图的网络环境中，网络 A 与网络 B 之间无法直接进行通讯，为了让它们之间正常通讯，这时必须得采用 IP 隧道的功能。IP 隧道可以将那些从网络 A 发过来的 IPv6 的包统合为一个数据，再为之追加一个 IPv4 的首部以后转发给网络 C。一般情况下，紧接着 IP 首部的是 TCP 或 UDP 的首部。然而，现在的应用当中“ IP 首部的后面还是 IP 首部”或者“ IP 首部的后面是 IPv6 的首部”等情况与日俱增。这种在网络层的首部后面追加网络层首部的通讯方法就叫做“ IP 隧道”。