`
simohayha
  • 浏览: 1403610 次
  • 性别: Icon_minigender_1
  • 来自: 火星
社区版块
存档分类
最新评论

ip层和4层的接口实现分析

阅读更多
首先来看一下基于3层的ipv4以及ipv6实现的一些4层的协议:





这里要注意并没有IGMPV6,这是因为在ipv6中,它是作为iCMPv6的一部分实现的.


首先我们要知道输入数据包的ip头中的protocol域标识了,将要传递的4层协议.


我们这里主要介绍的是ip数据包从3层传递到4层的接口(也就是输入帧接口).而输出帧的处理,我前面的blog都已经有介绍,想了解的话,可以去看前面的blog.

先来看主要的数据结构,然后我们会分析ip_local_deliver_finish函数(也就是3层处理的出口函数).

在内核中,每一个4层协议都是一个net_protocol结构体,而内核会在启动的时候将所有的4层协议都注册到一个数组inet_protos中,然后根据数据包的ip头来得到相应的handle函数:

struct net_protocol {
///协议的处理函数,也就是将要处理输入数据报的4层协议的处理函数.
	int			(*handler)(struct sk_buff *skb);
///协议的错误处理函数.
	void			(*err_handler)(struct sk_buff *skb, u32 info);
///gso相关的两个函数.
	int			(*gso_send_check)(struct sk_buff *skb);
	struct sk_buff	       *(*gso_segment)(struct sk_buff *skb,
					       int features);

///主要是被ipsec所使用的两个域
	unsigned int		no_policy:1,
				netns_ok:1;
};



L4的协议都是在linux/in.h这个文件中,都是以IPPROTO开头的一些宏.由于ip头中的4层协议域是8位,因此4层协议的最大数值也就是255.而在内核中,255是raw ip, IPPPROTO_RAW:

enum {
  IPPROTO_IP = 0,		/* Dummy protocol for TCP		*/
  IPPROTO_ICMP = 1,		/* Internet Control Message Protocol	*/
  IPPROTO_IGMP = 2,		/* Internet Group Management Protocol	*/
  IPPROTO_IPIP = 4,		/* IPIP tunnels (older KA9Q tunnels use 94) */
  IPPROTO_TCP = 6,		/* Transmission Control Protocol	*/
  IPPROTO_EGP = 8,		/* Exterior Gateway Protocol		*/
  IPPROTO_PUP = 12,		/* PUP protocol				*/
  IPPROTO_UDP = 17,		/* User Datagram Protocol		*/
  IPPROTO_IDP = 22,		/* XNS IDP protocol			*/
  IPPROTO_DCCP = 33,		/* Datagram Congestion Control Protocol */
  IPPROTO_RSVP = 46,		/* RSVP protocol			*/
  IPPROTO_GRE = 47,		/* Cisco GRE tunnels (rfc 1701,1702)	*/

  IPPROTO_IPV6	 = 41,		/* IPv6-in-IPv4 tunnelling		*/

  IPPROTO_ESP = 50,            /* Encapsulation Security Payload protocol */
  IPPROTO_AH = 51,             /* Authentication Header protocol       */
  IPPROTO_BEETPH = 94,	       /* IP option pseudo header for BEET */
  IPPROTO_PIM    = 103,		/* Protocol Independent Multicast	*/

  IPPROTO_COMP   = 108,                /* Compression Header protocol */
  IPPROTO_SCTP   = 132,		/* Stream Control Transport Protocol	*/
  IPPROTO_UDPLITE = 136,	/* UDP-Lite (RFC 3828)			*/

  IPPROTO_RAW	 = 255,		/* Raw IP packets			*/
  IPPROTO_MAX
};



这里要上面列出的协议,并不是所有的都在内核态handle的,其中一些经常在用户态handle的例如(IPPROTO_RSVP).


内核是通过inet_add_protocol来添加协议到inet_protos数组中的,相应的还有一个删除方法,我们先来看inet_protos的结构:





这里要注意的就是读写inet_protos时,使用的是自旋锁,而只读时,使用的是RCU(Read-Copy Update).


然后来看inet_add_protocol的源码:



struct net_protocol *inet_protos[MAX_INET_PROTOS] ____cacheline_aligned_in_smp;


///这里只是举两个例子,tcp和udp的协议注册函数.我们这次暂时就不分析tcp和udp的处理函数了(我会在3层结束后,分析4层源码)
static struct net_protocol tcp_protocol = {
	.handler =	tcp_v4_rcv,
	.err_handler =	tcp_v4_err,
	.gso_send_check = tcp_v4_gso_send_check,
	.gso_segment =	tcp_tso_segment,
	.no_policy =	1,
	.netns_ok =	1,
};

static struct net_protocol udp_protocol = {
	.handler =	udp_rcv,
	.err_handler =	udp_err,
	.no_policy =	1,
	.netns_ok =	1,
};


int inet_add_protocol(struct net_protocol *prot, unsigned char protocol)
{
	int hash, ret;

///计算当前协议在数组中的slot.
	hash = protocol & (MAX_INET_PROTOS - 1);

///使用自旋锁.
	spin_lock_bh(&inet_proto_lock);
	if (inet_protos[hash]) {
		ret = -1;
	} else {
///将相应的prot添加到数组
		inet_protos[hash] = prot;
		ret = 0;
	}
	spin_unlock_bh(&inet_proto_lock);
	return ret;
}





然后这些协议的注册都是在内核boot的时候在inet_init中初始化的,下面就是inet_init的代码片段.:

static int __init inet_init(void)
{
	...........................................
	/*
	 *	Add all the base protocols.
	 */

	if (inet_add_protocol(&icmp_protocol, IPPROTO_ICMP) < 0)
		printk(KERN_CRIT "inet_init: Cannot add ICMP protocol\n");
	if (inet_add_protocol(&udp_protocol, IPPROTO_UDP) < 0)
		printk(KERN_CRIT "inet_init: Cannot add UDP protocol\n");
	if (inet_add_protocol(&tcp_protocol, IPPROTO_TCP) < 0)
		printk(KERN_CRIT "inet_init: Cannot add TCP protocol\n");
#ifdef CONFIG_IP_MULTICAST
	if (inet_add_protocol(&igmp_protocol, IPPROTO_IGMP) < 0)
		printk(KERN_CRIT "inet_init: Cannot add IGMP protocol\n");
#endif

..................................
}


知道协议如何注册之后,我们来分析ip_local_deliver_finish函数,来看3层是如何将数据包发送到4层的.

1 我们知道linux支持raw数据包的发送,因此在这里会对raw socket进行了特殊处理,它会clone一份数据包然后传递给相应的raw处理函数,然后再继续后面的处理.

2 ipsec.这时还需要加上相应的ipsec头,然后再传给4层处理.看下面的图:







static int ip_local_deliver_finish(struct sk_buff *skb)
{

///取出相应的net信息.
	struct net *net = dev_net(skb->dev);
///下面两个主要是调整data指针,使data指针指向4层的数据开始处.
	__skb_pull(skb, ip_hdrlen(skb));
	skb_reset_transport_header(skb);

///加rcu锁.
	rcu_read_lock();
	{
///取出ip头中的协议.
		int protocol = ip_hdr(skb)->protocol;
		int hash, raw;
		struct net_protocol *ipprot;

	resubmit:
///得到raw socket, 如果不是raw socket,则返回0.
		raw = raw_local_deliver(skb, protocol);

///计算4层协议的slot.
		hash = protocol & (MAX_INET_PROTOS - 1);
///rcu读取相应的协议处理结构.
		ipprot = rcu_dereference(inet_protos[hash]);
///主要是ipprot是否有被当前主机注册.
		if (ipprot != NULL && (net == &init_net || ipprot->netns_ok)) {
			int ret;

///判断ipsec,并进行相关处理.
			if (!ipprot->no_policy) {
				if (!xfrm4_policy_check(NULL, XFRM_POLICY_IN, skb)) {
					kfree_skb(skb);
					goto out;
				}
				nf_reset(skb);
			}
///调用handler,进入相应的4层协议的处理.
			ret = ipprot->handler(skb);
			if (ret < 0) {
				protocol = -ret;
				goto resubmit;
			}
			IP_INC_STATS_BH(net, IPSTATS_MIB_INDELIVERS);
		}
................................................
 out:
	rcu_read_unlock();

	return 0;
}


最后来看一下raw socket的处理,通过上面我们知道,会调用raw_local_deliver来进行raw socket的相关处理(如果没有raw socket,则会直接返回):


当应用程序使用raw ip socket,他只需要攒递给内核协议id(4层的协议),以及目的地址.因此这里存取sock的hash表使用的key就是4层协议id.

///相应的hash表,保存raw socket.
struct raw_hashinfo {
	rwlock_t lock;
	struct hlist_head ht[RAW_HTABLE_SIZE];
};

static struct raw_hashinfo raw_v4_hashinfo = {
	.lock = __RW_LOCK_UNLOCKED(raw_v4_hashinfo.lock),
};



int raw_local_deliver(struct sk_buff *skb, int protocol)
{
	int hash;
	struct sock *raw_sk;
///通过协议计算hash值(使用4层协议id).
	hash = protocol & (RAW_HTABLE_SIZE - 1);
///得到相应的raw_sk.
	raw_sk = sk_head(&raw_v4_hashinfo.ht[hash]);

	/* If there maybe a raw socket we must check - if not we
	 * don't care less
	 */
///交给raw socket的处理函数,raw_v4_input中会clone一个skb,然后交给最后的raw_rev函数去处理最终的数据包.
	if (raw_sk && !raw_v4_input(skb, ip_hdr(skb), hash))
		raw_sk = NULL;

	return raw_sk != NULL;

}


  • 大小: 13 KB
  • 大小: 45.1 KB
  • 大小: 21.1 KB
分享到:
评论

相关推荐

    IP包流量分析WINPCAP实现

    标题中的“IP包流量分析WINPCAP实现”指的是利用WINPCAP库进行网络数据包捕获和流量分析的技术。WINPCAP(Windows Packet Capture)是一个开源的、系统级的网络数据包过滤和分析库,主要在Windows操作系统上使用。它...

    java实现ip数据包的分析

    Java 实现 IP 数据包分析是一项涉及网络编程与协议解析的技术工作。在 Java 中,我们可以使用 `java.net` 包中的 Socket 和 Datagram 类来处理网络通信,但这些类并不直接支持 IP 层的数据包操作。因此,要进行 IP ...

    Cisco 多层交换机配置层3接口

    2. 配置SVI接口的IP地址和子网掩码: ```plaintext Cisco3550(config-if)#ip address 192.168.1.1 255.255.255.0 ``` 3. 启用该接口: ```plaintext Cisco3550(config-if)#no shutdown ``` 4. 返回到全局...

    IP包流量分析程序的设计与实现

    【IP包流量分析程序的设计与实现】 ...总的来说,设计和实现一个IP包流量分析程序是理解和优化网络性能的关键步骤。通过Java这样的高级编程语言,我们可以构建出强大且灵活的工具,以应对不断变化的网络环境和需求。

    IP流量分析程序

    这需要理解IP地址和网络接口层的工作原理。本地地址通常指的是本机的IP地址,分析这些包有助于我们了解本地计算机与其他设备之间的通信情况。开发者可能使用了IP头信息来判断数据包的源或目标地址。 然后,“解析其...

    网路岗7-IP报文分析工具_IP分析工具_

    本文将深入探讨“网路岗7-IP报文分析工具”这一专业工具,它主要用于分析TCP/IP协议,帮助用户实现协议解析与监听。 首先,我们要了解TCP/IP协议族。TCP/IP(Transmission Control Protocol/Internet Protocol)是...

    用Java实现对IP/TCP协议数据包的拦截和分析

    本文将深入探讨如何利用Java编程语言实现对IP和TCP协议数据包的拦截与分析,以便获取IP地址的详细信息。 首先,我们需要理解IP(Internet Protocol)和TCP(Transmission Control Protocol)的基本概念。IP协议负责...

    Linux 4.4.0 内核源码分析 TCP实现

    CUBIC作为Linux默认的拥塞控制算法,它的接口实现和状态处理对于理解Linux的TCP性能至关重要。 释放TCP连接的过程同样复杂。无论是主动关闭还是被动关闭,TCP连接的关闭都需要经过一系列的握手过程,以确保数据的...

    Linux内核 tcp ip协议栈源码分析

    4. **网络接口层**: 网络接口层处理硬件层面的通信,如以太网、无线网络等。这部分源码在`net/core/dev.c`和`drivers/net`目录下,实现了驱动程序与协议栈之间的接口。 5. **数据包的收发**: 数据包的接收和...

    Wireshark之IP协议分析.zip

    通过实际操作和观察,我们可以深入理解网络层的工作原理,这对网络管理员、安全分析师和IT专业人士来说都是非常有价值的技能。同时,掌握这些知识也有助于解决网络性能问题和防止潜在的安全威胁。

    IpPacket 流量分析

    流量分析则是对这些IP包进行解析和统计的过程,以便获取网络活动的详细信息。 首先,我们需要了解流量分析的基本步骤。这通常包括数据捕获、数据过滤、数据解析和数据分析。数据捕获是使用嗅探器(如Wireshark)等...

    OSI七层协议模型和TCPIP四层模型

    4. **网络接口层**:对应OSI模型中的数据链路层和物理层,处理数据的实际发送和接收。 #### 四、OSI与TCP/IP模型之间的关系 1. **概念借鉴**:TCP/IP模型在一定程度上借鉴了OSI模型的概念,如分层思想和服务、接口...

    MPEG4IP的源码 MPEG-4IP源代码

    通过研究和分析MPEG4IP源码,开发者不仅可以学习到多媒体编码和解码的基本原理,还能深入了解MPEG-4标准的实现细节。此外,源码中还包含了构建工程文件,这意味着可以直接编译和运行,这对于测试和调试是极其宝贵的...

    3层交换机实现VLAN之间通信

    ### 三层交换机实现VLAN之间通信的知识点...通过以上对实训项目的详细介绍和分析,我们可以深入理解三层交换机如何实现VLAN之间的通信,并且掌握具体的配置方法和技术要点。这对于网络工程师来说是一项非常实用的技能。

    IP流量包分析程序

    在IP流量包分析程序中,RAW SOCKET模式至关重要,因为它使得程序可以直接读取和处理IP层的数据,而不是依赖于上层协议的封装。这为深入的流量分析提供了可能,但同时也需要开发者具备更深入的网络协议知识。 在开发...

    ip数据包抓取,分析ip数据报格式

    本主题将深入探讨如何使用C语言来抓取和分析IP数据报的格式。首先,我们来理解IP数据包的基本结构。 IP数据包由两部分组成:头部和数据部分。头部通常包含20到60字节的信息,而数据部分则承载上层协议(如TCP、UDP...

    基于WinCap和MFC的TCP/IP抓包程序

    它通过捕获网络接口层的数据包,为开发者、网络安全专家和系统管理员提供深入的网络诊断信息。WinCap(通常指的是Wireshark的前身)是一种强大的网络封包分析软件,它允许我们查看网络上流通的数据包,解析其内容,...

    应用结构和编程接口.rar_TCP/IP协议编程_ip

    "应用结构和编程接口.rar_TCP/IP协议编程_ip"这个压缩包文件,显然聚焦于TCP/IP协议编程和IP层的理解与应用,特别是从应用层的角度出发。这里我们将深入探讨相关知识点。 首先,TCP/IP协议族是由四层模型构成:应用...

Global site tag (gtag.js) - Google Analytics