Sigcomm2015 Congestion Control for Large-Scale RDMA Deployments(DCQCN) 论文阅读笔记

最新推荐文章于 2026-03-09 04:29:53 发布

原创

最新推荐文章于 2026-03-09 04:29:53 发布 · 3.9k 阅读

标签

#网络 #交换机 #队列

收录于

文章目录

背景
优先级流控制（PFC）
DCQCN的设计
总结
- 优点
- 缺点

Sigcomm 2015年的论文“Congestion Control for Large-Scale RDMA”开启了RDMA中的拥塞控制算法的学习。虽然这篇论文提出的拥塞控制机制DCQCN总是被后来的论文拿出来鞭尸，但是作为第一个吃螃蟹论文还是非常值得深入一读的。

背景

RDMA（Remote Direct Memory Access）技术是一种直接在内存和内存之间进行数据互传的技术，在数据传输的过程中完全实现了Kernel Bypass，CPU不需要参与操作，这也是RDMA在降低CPU消耗的同时，还能带来低时延的原因。
RDMA与TCP/IP模式示意图

TCP占用CPU资源多。使用RDMA以后吞吐量大，cpu消耗低，延迟低。深究原因，一般收发数据，要经过操作系统内核处理封装，然后再通过网卡发送。这个过程会产生中断，并且消耗cpu资源，在相同的吞吐量下，流越小那么造成的中断次数就越多，cpu消耗越大。rdma就是数据直接在内存和网卡之间交流，不用走内核了，节约cpu资源。

RDMA必须要部署在无损网络之上，而无损网络的实现就要启用PFC机制。