`
不爱不见
  • 浏览: 287334 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

TCP_BBR拥塞控制算法解析

 
阅读更多
引用自:
   https://blog.csdn.net/ebay/article/details/76252481

摘要
2016年底,Google发表了一篇优化tcp传输算法的文章,极大的提高了tcp得throughput,并且已经集成到Linux 4.9 内核。本文给出了论文中省略的一些背景知识,并结合自己的理解做了更加细节的介绍,可以帮助读者理解整个bbr算法。

1.背景
1.1TCP 基于丢包的拥塞控制
TCP拥塞控制将丢包视为网络出现拥塞的信号,以下为其四个主要过程:


引用自参考资料[5]

(1)慢启动阶段(slow start)
当建立新的TCP连接时,拥塞窗口(congestion window,cwnd)初始化为一个数据包大小。源端按cwnd大小发送数据,每收到一个ACK确认,cwnd就增加一个数据包发送量,这样cwnd就随着回路响应时间(Round Trip Time,RTT)的增加呈指数增长。
(2)拥塞避免阶段(congestion avoidance)
如果TCP源端发现超时或收到3个相同ACK时,即认为网络发生了拥塞。此时就进入拥塞避免阶段。慢启动阈值(ssthresh)被设置为当前拥塞窗口大小的一半;如果超时,拥塞窗口被置1。当cwnd>ssthresh,TCP就执行拥塞避免算法,此时,cwnd在每次收到一个ACK时只增加1/cwnd个数据包。这样,在一个RTT内,cwnd将增加1,所以在拥塞避免阶段,cwnd线性增长。
(3)快速重传阶段(Fast Retransmit)
快重传要求接收方在收到一个失序的报文段后就立即发出重复确认(为的是使发送方及早知道有报文段没有到达对方)而不要等到自己发送数据时捎带确认。快重传算法规定,发送方只要一连收到三个重复确认ACK就应当立即重传对方尚未收到的报文段,而不必继续等待设置的重传计时器RTO超时。
(4)快速恢复阶段(Fast Recovery)
与快速重传配合使用,有以下两个要点:
①当发送方连续收到三个重复确认时,就执行“乘法减小”算法,即把ssthresh门限减半。但是接下去并不执行慢开始算法。
②考虑到如果网络出现拥塞的话就不会收到好几个重复的确认,所以发送方现在认为网络可能没有出现拥塞。所以此时不执行慢开始算法,而是将cwnd设置为ssthresh的大小,然后执行拥塞避免算法。


2.动机
2.1 基于丢包的拥塞控制算法的两大缺陷
(1)不能区分是拥塞导致的丢包还是错误丢包
基于丢包的拥塞控制方法把数据包的丢失解释为网络发生了拥塞,而假定链路错误造成的分组丢失是忽略不计的,这种情况是基于当时V. Jacobson的观察,认为链路错误的几率太低从而可以忽略,然而在高速网络中,这种假设是不成立的,当数据传输速率比较高时,链路错误是不能忽略的。在无线网络中,链路的误码率更高,因此,如果笼统地认为分组丢失就是拥塞所引起的,从而降低一半的速率,是对网络资源的极大浪费。
(2)引起缓冲区膨胀
我们会在网络中设置一些缓冲区,用于吸收网络中的流量波动,在连接的开始阶段,基于丢包的拥塞控制方法倾向于填满缓冲区。当瓶颈链路的缓冲区很大时,需要很长时间才能将缓冲区中的数据包排空,造成很大的网络延时,这种情况称之为缓冲区膨胀。在一个先进先出队列管理方式的网络中,过大的buffer以及过长的等待队列,在某些情况下不仅不能提高系统的吞吐量甚至可能导致系统的吞吐量近乎于零。并且当所有缓冲区都被填满时,会出现丢包。
2.2 网络工作的最优点是可达到的


引用自参考资料[1]
当网络中数据包不多,还没有填满瓶颈链路的管道时,随着投递率的增加,往返时延不发生变化。当数据包刚好填满管道,达到网络工作的最优点(满足最大带宽BtlBw和最小时延RTprop),定义带宽时延积BDP=BtlBw × RTprop,则在最优点网络中的数据包数量=BDP。继续增加网络中的数据包,超出BDP的数据包会占用buffer,达到瓶颈带宽的网络的投递率不再发射变化,RTT会增加。继续增加数据包,buffer会被填满从而发生丢包。故在BDP线的右侧,网络拥塞持续作用。过去基于丢包的拥塞控制算法工作在bandwidth-limited区域的右侧边界,将瓶颈链路管道填满后继续填充buffer,直到buffer填满发生丢包,拥塞控制算法发现丢包,将发送窗口减半后再线性增加。过去存储器昂贵,buffer的容量只比BDP稍大,增加的时延不明显, 随着内存价格的下降导致buffer容量远大于BDP,增加的时延很大。


3.基本观点
(1)不考虑丢包
(2)估计最优工作点 (max BW, min RTT)



上图红色圆圈所示即为网络工作的最优点,此时数据包的投递率=BtlBW(瓶颈链路带宽),保证了瓶颈链路被100%利用;在途数据包总数=BDP(时延带宽积),保证未占用buffer。


然而max BW和min RTT不能被同时测得。要测量最大带宽,就要把瓶颈链路填满,此时buffer中有一定量的数据包,延迟较高。要测量最低延迟,就要保证buffer为 空,网络中数据包越少越好,但此时带宽较低。
BBR的解决办法是:
交替测量带宽和延迟,用一段时间内的带宽极大值和延迟极小值作为估计值。

4.设计细节
4.1BBR的四个状态(启动、排空、带宽探测、时延探测)

(1)当连接建立时,BBR采用类似标准TCP的slow start,指数增加发送速率,目的也是尽可能快的占满管道,经过三次发现投递率不再增长,说明管道被填满,开始占用buffer它进入排空阶段(事实上此时占的是三倍带宽*延迟)
(2)在排空阶段,指数降低发送速率,(相当于是startup的逆过程)将多占的2倍buffer慢慢排空
(3)完成上面两步,进入稳定状态后,BBR改变发送速率进行带宽探测:先在一个RTT时间内增加发送速率探测最大带宽,如果RTT没有变化,后减小发送速率排空前一个RTT多发出来地包,后面6个周期使用更新后的估计带宽发包
(4)还有一个阶段是延迟探测阶段:BBR每过10秒,如果估计延迟不变,就进入延迟探测阶段,为了探测最小延迟,BBR在这段时间内发送窗口固定为4个包,即几乎不发包,占整个过程2%的时间。

4.2带宽的动态更新(带宽探测)

带宽探测占据BBR绝大部分时间。在startup阶段,BBR已经得到网络带宽的估计值。在带宽探测阶段,BBR利用一个叫做 cycle gain的数组控制发送速率,进行带宽的更新。cycle gain数组的值为 5/4, 3/ 4, 1, 1, 1, 1, 1, 1,BBR将max BtlBW*cycle gain的值作为发送速率。一个完整的cycle包含8个阶段, 每个阶段持续时间为一个RTprop。
故如果数组的值是1,就保持当前的发送速率,如果是1.25,就增加发送速率至1.25倍BW,如果是0.75,BBR减小发送速率至0.75倍BW。


上图显示的是一个a 10-Mbps, 40-ms的数据流在第20s时网络带宽增加一倍至20 Mbp时,BBR是如何更新的。向上的尖峰表明它增加发送速率,向下的尖峰表明它降低发送速率,如果带宽不变,增加发送速率肯定会使RTT增加,降低发送速率是为了让他要把上一周期多发的包排空,如果带宽增加,则增加发包速率时RTT不变。这样经过三个周期之后,估计的带宽也增加了一倍。


上图所示为在第40s,是当网络带宽由20 Mbps减半至10 Mbps时,BBR的带宽探测如何发挥作用。因为发送速率不变,inflight增加,多出来的数据包占用了buffer,RTT增加,BBR从而减小发送速率,经过4秒后,有效带宽也降低为一半。
4.3多条BBR数据流分享瓶颈链路带宽




上图所示为多条独立的BBR数据流分享100-Mbps/10-ms瓶颈链路的情况:一条连接独占整个链路时,它的可用带宽近似为链路的物理带宽,n条连接共享链路时,最理想最公平的情况就是BW/n。每条连接的startup阶段都会尝试增加带宽,所以吞吐量会有一个向上的尖峰,已经在链路中的连接会检测到拥塞而减小自己的发送速率,吞吐量会下降。
最后通过反复的带宽探测,他们都会趋于收敛,带宽得到均分。


5.实验结果



上图所示为CUBIC(红线)和BBR(绿线)的RTT 随时间的变化:
CUBIC(红线):可见周期性地延迟变化,缓存几乎总是被填满。
BBR(绿线):除了在statup和drain阶段,RTT会发生较大的变化,在网络带宽保持不变时,RTT只有细微的变化,这些小尖峰是BBR尝试增加发包速率产生的,每8个往返延迟为周期的延迟细微变化。



上图所示为在有随机丢包情况下BBR(绿线)和CUBIC(红线)吞吐量的比较。
如图所示,CUBIC(红线)在万分之一丢包率的情况下,CUBIC带宽只剩30% 千分之一丢包率时只剩10%,在百分之一丢包率时就几乎没有吞吐量 。而 BBR在丢包率5%以下几乎没有带宽损失。


上图中,横轴是CUBIC的吞吐量,纵轴是BBR的吞吐量与CUBIC吞吐量之比,可见在吞吐量情况低的情况下,BBR与CUBIC吞吐量之比很大 ,说明吞吐量越低的网络,BBR性能越卓越。
6.总结
(1)吞吐量的显著提高
BBR已经在Google跨数据中心的内部广域网(B4)上部署,相对于CUBIC,BBR的吞吐量提高了133
(2)易于集成
能够在开源的Linux kernel中应用且只需要改变数据发送端。


7.参考资料
[1]Cardwell,Neal,et al.BBR:Congestion-Based Congestion Control.Queue14.5(2016):50.
[2]Yuchung Cheng,Neal Cardwell.Making Linux TCP Fast[EB/OL]. [2016-10].
http://netdevconf.org/1.2/slides/oct5/04_Making_Linux_TCP_Fast_netdev_1.2_final.pdf
[3]李博杰.Linux Kernel 4.9 中的 BBR 算法与之前的 TCP 拥塞控制相比有什么优势[EB/OL].[2016-12-15
].https://www.zhihu.com/question/53559433.
[4]Bomb250.来自Google的TCP BBR拥塞控制算法解析[EB/OL].[2016-10-16].http://blog.csdn.
net/dog250/article/details/52830576.
[5]陈皓.TCP 的那些事儿(下)[EB/OL].[2014-5-28].http://coolshell.cn/articles/11609.html.
————————————————
版权声明:本文为CSDN博主「ebay」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/ebay/article/details/76252481
分享到:
评论

相关推荐

    BBR拥塞控制算法在无线网络中的性能改进.pdf

    传统的拥塞控制算法(如TCP的拥塞避免算法)在当前复杂的网络环境中已经不能很好地适应了。BBR算法尝试通过测量网络瓶颈带宽和往返时间来优化数据传输过程,旨在提高网络链路上的有效吞吐量并减少延迟。 然而,BBR...

    bbr.rar_bbr_bbr一键脚本_linux bbr卸载_联合开发_魔改bbr

    BBR(Battery Backup Reporting)是Google推出的一种TCP拥塞控制算法,旨在提高网络传输效率,减少延迟,并在高丢包环境中提供更好的性能。这个技术主要应用于服务器和数据中心环境,通过优化TCP连接,使得数据在...

    bbr-src-1.3.3.rar_ bbr-s_/bbr.cgi_bbr_路由器 linux web_路由器 界面

    标题中的“bbr-src-1.3.3.rar”是一个软件源码的压缩包,版本...它包含了BBR拥塞控制算法,并提供了多语言的Web管理界面,便于用户配置和监控路由器。由于提供了源代码,开发者可以根据自己的需求对其进行定制和改进。

    计算机网络实验四-拥塞控制算法

    • 理解数据传输过程中可能会发生拥塞 • 了解数据传输过程中发生拥塞时的现象和表现 • 理解拥塞控制算法的基本思想 • 理解不同拥塞控制算法的基本工作原理和区别 ...• TCP-bbr拥塞控制算法; • OMNet++模拟器;

    BBR算法介绍 04_Making_Linux_TCP_Fast_netdev_1.2_final.pdf

    BBR(Bottleneck Bandwidth and Round-trip propagation time)是一种由谷歌开发的TCP拥塞控制算法,旨在提高网络效率并降低数据传输时的延迟。该算法的核心思想是通过探测网络瓶颈带宽(BBR)和往返时间(RTT)来...

    [译] [论文] BBR:基于拥塞(而非丢包)的拥塞控制(ACM, 2017)1

    BBR拥塞控制算法详解 BBR(Bottleneck Bandwidth and Round-trip propagation time)是一种基于拥塞本身的拥塞控制算法,由Google网络团队设计并实现。该算法可以准确地测量瓶颈带宽和往返传输时间,从而实现高效的...

    基于LwIP 的 TCP 拥塞控制方法的改进

    ### 基于LwIP的TCP拥塞控制方法改进:深入解析与实施建议 #### 概述 在探讨LwIP(Lightweight IP)框架下TCP拥塞控制方法的改进之前,我们有必要先理解其核心意义。TCP(Transmission Control Protocol)作为...

    ns2_bbr:ns2网络模拟器的Google TCP BBR实现

    这是要在上使用的ns-2网络模拟器的Google BBR TCP拥塞控制算法的实现 这是一个未完成的实现,欢迎贡献。 TL; DR 该文件夹必须位于ns-allinone-2.35旁边(与ns-allinone-2.35处于同一级别)。 make patch make all ...

    tcp拥塞控制

    2. **拥塞控制算法的改进**:探索新的算法,如 Vegas、Bbr(Bottleneck Bandwidth and Round-trip propagation time)等,它们旨在提供更好的性能和更低的延迟。 3. **拥塞指示**:研究如何更准确地检测网络拥塞,...

    电信设备-基于TCP通信协议的拥塞窗口的控制算法和系统.zip

    本资料“电信设备-基于TCP通信协议的拥塞窗口的控制算法和系统”主要探讨了这一主题,我们将详细解析其中的知识点。 首先,TCP拥塞控制的目标是避免网络拥塞,同时尽可能地利用网络带宽。拥塞窗口是一种动态调整的...

    基于链路容量的多路径拥塞控制算法.docx

    1) 设计了一个多路径拥塞控制框架,将拥塞控制状态与TCP状态分离,使得多级反馈调节拥塞控制算法的实现更为灵活。 2) 引入BBR算法的链路容量反馈机制,优化发送窗口和发送速率,从而提升多路径传输的带宽利用率。 3)...

    tcp cubic算法学习笔记

    在本文中,我们将从基本概念、拥塞窗口、慢启动、拥塞控制、快速恢复、快重传、BBR算法、SACK机制等方面详细探讨tcp cubic算法的实现和原理。 一、基本概念 在tcp cubic算法中,有两个重要的概念:窗口(wnd)和...

    BBR Congestion-Based Congestion Control

    综上所述,BBR算法是一种不同于传统TCP拥塞控制算法的新方法。它通过测量和利用网络瓶颈带宽和往返时间来更精确地控制数据的发送速率,以减少因传统拥塞控制算法导致的延迟增加和吞吐量低下的问题。BBR的出现代表了...

    BBR算法在高速移动网络中的应用及改进

    BBR算法在高速移动网络中的应用及改进 BBR算法是Google提出的拥塞控制算法,旨在解决传统基于丢包类型的拥塞控制算法在高速移动网络中的传输性能问题。...关键词:高速移动网络、TCP拥塞控制、BBR算法 分类号:TP393

    网络游戏-无线数据网络中的拥塞控制.zip

    一些特定的拥塞控制算法,如TCP Vegas或TCP BBR,它们更注重降低延迟而不是最大吞吐量,可能更适合网络游戏环境。 除了TCP/IP层面的拥塞控制,网络游戏还可以在应用层进行优化。比如,采用UDP协议进行数据传输,...

    开放式拥塞控制OpenCC技术白皮书2020.pdf

    拥塞控制是解决网络拥堵问题的关键技术,白皮书中介绍了其发展历程,从早期的基本TCP/IP拥塞控制算法,如慢启动、拥塞避免等,到后来的快速重传和快速恢复,再到更先进的如TCP Vegas、TCP BBR等。这些算法都在不同...

    路由器中的拥塞控制技术研究.pdf

    然而,TCP在处理突发性流量和多路径传输时可能效率不高,这促使研究者提出诸如TCP Vegas、TCP BBR等新的拥塞控制算法,以提高网络效率和用户体验。 未来的研究趋势将聚焦于以下几个方向:一是开发更智能的AQM策略,...

    拥塞控制介绍2.zip

    此外,还有其他算法,如TCP Vegas和TCP BBR(Bottleneck Bandwidth and Round-trip propagation time),它们通过不同的方式检测和控制网络拥塞。 拥塞控制不仅限于TCP,UDP(用户数据报协议)和其他协议也可以通过...

    生产环境Linux系统优化方法.pdf

    * 上述参数用于启用Linux内核的TCP BBR拥塞算法,该算法优于传统的TCP协议默认拥塞算法。 * 用户可以根据需要修改参数,以提高系统性能和稳定性。 本文档提供了生产环境Linux系统优化方法的详细介绍,涵盖文件系统...

    tcp tuning

    - **BBR (Bottleneck Bandwidth and RTT)**:一种基于瓶颈带宽和往返时间的新型拥塞控制算法,旨在提供更稳定的网络性能。 - **CUBIC**:一种用于IPv4的拥塞控制算法,旨在提高网络吞吐量和公平性。 ### 5.2 其他...

Global site tag (gtag.js) - Google Analytics