前言
在上一篇,学习了链路层的以太网协议,知道了MAC地址,在以太网中,找到对应的终端最终依靠的是MAC地址,但是在实际使用中,大家可能发现并不是使用的MAC地址,而是IP协议,比如
(1)浏览器输入域名会通过DNS解析到IP地址;访问共享文件夹时,输入对方电脑的IP地址即可;在进入某个设备的后台的时候,输入对应设备的IP地址即可进入。
(2)博主比较喜欢看悬疑、推理、警匪的影视/电影,美剧里面经常会出现通过IP攻击了某个服务器、定位到了位置、通过技术获取到了监控画面,就算在港剧里面也会出现这样的桥段,某个犯罪嫌疑人利用公共场所网吧/网咖发布有害信息,警方很快就通过这个IP定位到了这个网吧位置所在,然后通过监控分析出犯罪嫌疑人的特征,进行抓捕。
(3)每个设备上面都会有对应的IP信息,包括电脑、手机、摄像头、网络设备、甚至智能家居都会有。
通过生活中使用以及影视剧之类可以得到一些信息。
- 每个设备除了MAC地址以外,还需要有IP,否则在如今的网络中(TCP/IP协议体系)是无法通信的,
- IP具有定位跟追踪功能,网上流传一句话,顺着网线来找你,这并不是一个玩笑,只要在你做了违法的事情,这些事情都会基于IP信息以及其他有用的信息被记录在对应服务器上面,执法者就可以定位并追踪逮捕你。
IP协议
IP协议是网络层唯一的协议,全称Internet Protocol(互联网协议),也是TCP/IP协议体系中最核心的协议之一,通过IP地址,保证了联网设备的唯一性,IP最大的特性是为两个终端之间的通信提供更高的效率、更高的传输速度,也带来了弊端,就是无连接以及不可靠的传输。
这个图是不是很熟悉,没错就是第二篇里面的,但是这里扩展了一下,比如图上面的访问者1、2、3,都需要访问WEB服务器,这个时候WEB服务器怎么去区分跟识别这三个请求,又怎么去保证能够正常返回。
想象一下我们实际生活中,全国人口这么多,如果单独用姓名来区分,重名的非常多,这个时候就需要一个唯一能标识自己身份的东西,那就是身份证,重名了没关系,身份证的ID是唯一的,在网络世界中,也是一样,为了唯一性,给每个设备也加入一个“身份ID”,在通信的过程中,携带“身份ID”信息包含在数据包里面,这样在服务器收到以后,能够准确的回复。
在网络中的“身份ID”就是IP地址,这样在访问的过程中,将IP地址携带在数据包中,服务器收到以后就能够明确是谁发的,返回的时候根据IP地址返回即可。
这里以访问者1(12.1.56.6)访问服务器(1.1.1.1)举例(这里只看网络层)
- 访问者1把请求服务器的数据前面封装源目IP(源:12.1.56.6,目的:1.1.1.1),将这个带有IP地址信息的数据包发送给interent。
- Internet上面是有许许多多的网络设备,比如路由器,它们收到这个数据包后会根据包里面的目的IP地址,通过查询路由表,会把这个数据包发送给它最近的邻居设备,这样以接力棒的形式抵达目的地。服务器收到数据请求后,处理完,要把这个结果返回给访问者1,这个时候它会把源目IP地址调换(源:1.1.1.1,目的:12.1.56.6),将这个数据包封装发到互联网,最终同样的方式回到访问者1。
这个过程在第二篇就介绍过了,以生活中快递的形式代入,把包裹当成数据包,把快递单号当成源目IP(快递单号包含发件人与收件人),快递公司的运输工具当成internet中的路由器等设备,在运输途中,根据单号的收件人地址(目的IP)来运输,中途会进行中转,交给另外的运输车继续运输(路由器通过查询路由表,交给下一个设备继续处理一样),最终到达收件人的手里。
通过以上内容可以得到的信息
- IP协议中提供了IP地址,在数据包中包含源目IP地址,中间处理数据包的路由器可以根据目的地址查询路由表来得到转发的方向(交给谁处理)
- IP地址中的源IP给接收方提供了一个回复的信息,它可以根据这个源进行正确的响应。
- IP协议虽然数据包中包含了源目地址信息,但是一旦这个数据包发送出去后,不一定保证能够到达地方,比如中途路由线路坏了或者它也不知道目的地怎么走(类似于快递中丢件了),这里就正好体现了IP协议的弊端,无连接以及不可靠的传输特性。那带来了一个问题,如果真出现了丢包,IP协议不能处理,谁处理呢?这个就是后面要提到的TCP协议。
IP协议的报文格式
在上一篇二层的以太网协议中,了解过以太网的报文格式,那么在IP协议中它也有自己的报文格式,正式因为有了这个格式,数据在从上往下封装的时候,才能完整的生成一个对应每层的头部。
红色标记的是目前对于初学者来说是必须知道的,其余的可以等有一定基础后在回过头了解,否则记得太多会有点混乱。(下面会介绍下每个字段的作用)
- 版本:4个比特,标识当前的IP协议版本,这里为IPV4(IPV6的数据包结构有所调整)。
- 头部长度:4个比特,标识整个IP头部的长度,正常情况下IP头部为20个字节,最大为60字节。
- 服务类型:8个比特,为不同的IP数据包给予不同的服务质量,用于QOS技术。
- 总长度 :16个比特,标识IP头部以及上层数据的数据包大小,IP包最大为65535个字节。
- 标识符:16个比特,用来实现IP分片的重组功能,为每个分配打上标记。
- 标记符:3个比特,用来表示是否还有IP分片或是否允许分片。
- 分片偏移:13个比特,明确告诉这个IP分片的位置,方便接收端收到后进行IP分片的重组。
- 生存时间:8个比特,早期定义是这个数据包在传输中的时间单位,但是后续发现不可行,改成了每经过一个三层设备,TTL减少1,直到变成0则直接丢弃,避免数据包在网络中无休止的传递,起到了防止环路的作用,并且每个系统的TTL不一样,Windows个人版本TTL为64,Windows服务器版本为128,Linux为64,常见的网络设备为255跟64两种。
- 协议:8个比特,标识IP协议上层使用的协议,第二章介绍到的TCP协议号为6,UDP协议号为17(这个会随着学习慢慢的接触更多,目前记住TCP与UDP的协议号即可)
- 头部校验和:16个比特,用于检验IP数据包是否完整以及被修改,校验失败则直接丢弃。
- 源地址:32个比特,表明发送端的IP地址
- 目的地址:32个比特,表明目的端(接收端)的IP地址。
- 可选项:这个字段很少使用。
一个标准的IP头有12个字段,对于刚接触网络的朋友来说,不要求全部掌握,红色部分是必须掌握的,其余的暂时作为可选,但是需要了解下作用,下面把相同作用的字段做一个知识点的汇总。
- 源地址(Source)和目的地址(Destionation)作为IP协议最核心的字段,表明这个数据包源是谁,目的去往哪,这个在上面已经举例了作用了,这里就不在重复。
- 头部长度(Header Length)和总长度(Total Length)表明IP头部与数据的大小,进行区分标明。
标明区分了IP头部与数据有什么作用呢,比如上图,可以知道IP协议的头部是20个字节,总长度是200个字节,那么去掉头部后剩下180个字节,我们可以回想下第二篇讲解的,路由器收到一个数据包后,它需要解封装拆除IP头的信息,读取里面的目的IP地址信息,甚至有时候需要修改IP的信息,完成后在重新进行封装操作,那么路由器怎么知道这个IP头的范围呢,IP头部默认是20个字节,最大可以60个字节,不是固定的,万一它在操作的时候把数据部分也当成IP头部的一部分进行修改,那这个数据包的内容不就遭到破坏,从而变的没有任何意义,所以标明区分IP头部与数据的范围后,设备就有了一条明确的分界线,避免了这样的情况发生。
- 生存时间(TTL):标识IP数据包的”存活时间”,不通的操作系统初始的TTL值不一样,常见的比如64、128、255,IP数据包经过一个三层设备,TTL会减去1,当TTL=0的时候,表示这个数据包“GG”,这个时候处理这个数据包的设备会返回一个通知,告知发起者的终端(这个后续会讲解到)。
ping暂时还没讲解(暂时不用关注),可以发现不通的终端类型TTL是不一样的,PC为64,服务器为128,这个了解还是有些用的,后续我们可以通过TTL的值来判断这个终端是路由器、普通PC还是服务器。
TTL每次减少1,还有体现到了一个重要作用就是“被动防环路”,在某些时候,由于工程师的粗心导致网络”成环”了,数据包从1-2-3-4-5的路径这样走,会发现又回到A了,A继续发送,沿着2-3-4-5又回到A,这样循环,如果没有TTL的话,如果数据包一多,那么这个网络的的资源就会被消耗掉,有了TTL,每经过一个三层设备减去1,那么最终是会变成0的,0就会被丢弃,从而不会一直循环下去,但是这里要注意,这种方式只是一个“被动”的解决办法,真正的一个规划好的网络是不会存在在这种情况的。
- 协议(protocol):明确表明上层用的什么协议,比如TCP(6)、UDP(17),协议号记熟就可以了,其实可以发现,从上一篇学的以太网协议中也有一个类型字段标明上层协议,IP协议里面也有,那么这个存在的意义是什么呢?
比如访问者1发送了多个访问给服务器,有TCP的应用、UDP的应用,那服务器收到以后,它到底是交给TCP处理呢,还是UDP处理呢,所以有了protocol以后,服务器根据这个ID就能明确知道是交给哪个上层协议处理了,完成正确的交互。就像我们平时电脑使用的时候,不同的应用有不同的后缀名,有不同的应用程序去打开读取,如果有txt记事本去打开一部MP4的电影,那肯定是会出错,同样如果服务器处理TCP的数据采用UDP协议来处理,一样会出现错误。
最终,不管是以太网协议的类型字段,还是IP协议的protocol字段,以及接下来要学习的TCP、UDP协议的端口号,都在做一件事情,明确告诉接收方,用正确的上层协议来处理这个数据。
- 标识符(Identification)、标记符(Flags)、分片偏移(Fragment offset),这三个字段组合来完成IP数据的分片与重组。
- 头部校验和:跟以太网的FCS一样,但是IP协议只校验IP头部,数据部分不校验,交给上层处理。
IP协议总结
- IP地址作为接入Internet通信的“身份证”,每个终端设备只要需要接入网络,则必须拥有它。
- IP地址具有唯一性,终端在访问对应服务的时候,数据包里面会携带IP的源目地址,中间转发的设备通过数据包中的目的IP找到目的地怎么转发,目的地也根据源地址可以正常的进行返回。
- IP协议中除了IP地址的寻址功能以外,还包含了防环、校验、数据包分片与重组的功能。
“承上启下”
可以看到IP地址在IP协议中具有很重要的作用,甚至在如今互联网的使用中密不可分,像我们使用的身份证都有对应的分类,按省份、城市、地区、出生年月日等格式进行区分,那么IP地址的分类与格式是怎么样的呢?下一篇来进入一下IP地址的课题,这个也是让人很头疼的知识点。