Product-based Neural Network(PNN) - 学习笔记

最新推荐文章于 2026-05-13 17:24:58 发布

原创最新推荐文章于 2026-05-13 17:24:58 发布 · 405 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#机器学习 #深度学习 #推荐系统

推荐系统专栏收录该内容

10 篇文章

订阅专栏

这篇博客详细介绍了Product-based Neural Network（PNN）模型，重点在于其Product Layer的设计，包括内积形式和外积形式。内积形式通过特征向量的内积进行特征交叉，而外积形式则采用池化后再相乘的方式降低计算复杂度。PNN模型在处理多领域特征交叉问题时表现出优势，并在推荐系统中得到应用。

引言

这篇工作的着眼点是在特征交叉方面，提出了一个乘积层(product layer) 来对多个领域(field) 的特征进行充分的特征交叉。其中，product layer包含两种形式，分别是内积形式(inner product)和外积形式(outer product)。

整体的模型结构

在这里插入图片描述
上图是PNN的整体模型架构，这里简单介绍一下。

$I n p u t$ 是经过one-hot编码的稀疏向量，经过 $E m b e d d i n g$ 层生成稠密的特征向量矩阵 $x$ 。 $x[start_i:end_i]$ 表示第 $i$ 个 $f i e l d$ 的特征向量。

在 $LayerProduct\,Layer$ 中，包含 $z$ 和 $p$ 两部分， $z$ 是由 $" 1 "$ 信号和某个 $f i e l d$ 的特征组合而成，其实表示的是原始特征的恒等映射：
$z = (z_1,z_2,...,z_N) = (f_1,f_2,...,f_N)$
$p$ 是由任意两个 $f i e l d$ 的特征交叉而成:
$\left\{p_{i,j}\right\},i=1...N,j=1..N\\ p_{i,j} = g(f_i,f_j)$
对于内积操作， $g(f_i,f_j) = <f_i,f_j>$ ；对于外积操作， $g(f_i,f_j) = f_if_j^T$

得到 $z$ 和 $p$ 之后，通过以下公式进一步得到 $l_z$ 和 $l_p$ ：
$l_z = (l_z^1,l_z^2,...,l_z^n,...,l_z^{D_1})\\ l_p = (l_p^1,l_p^2,...,l_p^n,...,l_p^{D_1})\\ l_z^n = W_z^n\odot z\\ l_p^n = W_p^n\odot p\\ A \odot B \triangleq \sum_{i,j}A_{i,j}B_{i,j}$

$l_1$ 层的表达式为：
$l_1 = relu(l_z+l_p+b_1)$
$l_2$ 层的表达式为：
$l_2 = relu(W_2l_1+b_2)$
最后的输出为：
$y^=σ(W3l2+b3) \hat{y} = \sigma(W_3l_2+b_3)$

基于内积的Product Layer

内积操作的表达式为 $g(f_i,f_j) = <f_i,f_j>$ ，文章里进行了计算复杂度的讨论，有兴趣可以查看原文。作者为了减少复杂度，对 $W_p^n$ 进行了比较强的假设：
$W_p^n = \theta^n\theta^{n^{T}}$
通过这样的假设， $l_1$ 的表达式可以简化为：
$W_p^n\odot p= \sum_{i=1}^N\sum_{j=1}^N\theta_i^n\theta_j^n<f_i,f_j> = <\sum_{i=1}^Nδ_i^n,\sum_{i=1}^Nδ_i^n>$
其中， $δ_i^n$ 可以看作是向量 $f_i$ 乘以权重 $θin\theta_i^n$ 。通过以上推导， $l_p$ 可以改写为以下形式：
$l_p = (||\sum_iδ_i^1||,...,||\sum_iδ_i^n||,...,||\sum_iδ_i^{D_1}||)$

基于外积的Product Layer

由于外积操作的表达式为 $g(f_i,f_j) = f_if_j^T$ ,计算复杂度事非常高的，所以采用先池化再相乘的操作，以降低复杂度，具体可以看原论文：
$f_{\sum} = \sum_{i=1}^Nf_i \\p = \sum_{i=1}^N\sum_{j=1}^Nf_{\sum}(f_{\sum})^T$