基于空中计算的联邦学习:收敛分析与功率控制优化
1. 空中计算联邦学习的基础不等式
基于特定假设,我们得到关于梯度范数的不等式:
$|\nabla F(w^{(n)})| \leq \max_{(x,y)\in\mathcal{D}} |\nabla f(w^{(n)}, x, y)| \leq G^{(n)}$
结合另一假设,有:
$\mathbb{E}[|g_{k}^{(n)}|^2] \leq |\nabla F(w^{(n)})|^2 + \frac{|\sigma|_2^2}{m_b} \leq \hat{G}^{(n)} \triangleq (G^{(n)})^2 + \frac{|\sigma|_2^2}{m_b}$
2. 情况 I:无无偏聚合约束时的收敛分析
在无无偏聚合约束的情况下,我们分析空中计算联邦学习(AirComp - FL)关于传输功率的收敛行为。
- 梯度估计的偏差和均方误差
在每个通信轮次 $n$,根据 $\epsilon^{(n)}$ 的定义,梯度估计的偏差和均方误差如下:
- 偏差:
$|\mathbb{E}[\epsilon^{(n)}]| = \frac{|\nabla F(w^{(n)})|}{K} \left(\sum_{k\in\mathcal{K}} h_{k}^{(n)} \sqrt{p_{k}^{(n)}} - K\right) \leq \frac{G^{(n)}}{K} \left(\sum_{k\in\mathcal{K}} h_{k}^{(n)} \sqrt{p_{k}^{(n)}} - K\right)$
超级会员免费看
订阅专栏 解锁全文

549

被折叠的 条评论
为什么被折叠?



