【文献阅读笔记】Unsupervised Deep Embedding for Clustering Analysis

原创

已于 2024-01-22 09:15:50 修改 · 1.6k 阅读

·

24

·

标签

#笔记 #embedding #机器学习 #神经网络

于 2024-01-11 13:08:23 首次发布

文章介绍了一种名为DeepEmbeddedClustering(DEC)的无监督学习方法，它利用深度神经网络同时学习特征空间和聚类分配。DEC通过迭代优化基于KL散度的目标函数，自动生成特征表示并改进聚类效果。这种方法在特征空间选择和聚类任务中提供了一种数据驱动的解决方案。

标题（paper）：Unsupervised Deep Embedding for Clustering Analysis

期刊 + 时间 + 有无源代码： Proceedings of the 33 rd International Conference on Machine
Learning + 2016 + 没收集

作者： Junyuan Xie， Ross Girshick， Ali Farhadi

方法名及缩写： Deep Embedded Clustering
(DEC)

算法框架： 使用从当前软聚类分配中派生的辅助目标分布来迭代地改进聚类。这个过程逐步改进了聚类和特征表示。

DEC的工作原理是迭代优化基于KL散度的聚类目标和自训练目标分布。

流程图： 在这里插入图片描述

DEC模型分为两个部分：（1）自编码器用于参数初始化；（2）参数优化(即聚类)。

主要创新点： 利用深度神经网络同时学习特征空间和分配聚类。

动机： 特征空间的选择通常作为应用程序特定的细节留给最终用户来决定。然而很明显，特征空间的选择是至关重要的;除了最简单的图像数据集，在原始像素上使用欧几里德距离聚类是完全无效的。在本文中，我们重新审视了聚类分析，并提出了一个问题：我们能否使用数据驱动的方法来共同解决特征空间和聚类隶属关系?

目标函数：

第一部分：自编码器作非线性映射： $fθ:X→Zf_{\theta}:X\to Z$ 其中 $θ\theta$ 是可以学习的参数， $Z$ 潜在特征表示。

DEC：

（1）初始化参数 $θ\theta$ 和 $μj}j=1k\{\mu_j\}^k_{j=1}$ k个类的类中心点。

（2）利用KL散度进行聚类：

第一步计算软聚类
$q_{ij}=\frac{(1+\|z_i-\mu_j\|^2/\alpha)^{-\frac{\alpha+1}2}}{\sum_{j^{\prime}}(1+\|z_i-\mu_{j^{\prime}}\|^2/\alpha)^{-\frac{\alpha+1}2}},$
$α\alpha$ 是Students t 分布的自由度（ $α=1\alpha=1$ ）

$q_{ij}$ 是样本 $i$ 被分配到第 $j$ 个类的概率
KL 散度最小化
$L=\mathrm{KL}(P\|Q)=\sum_i\sum_jp_{ij}\log\frac{p_{ij}}{q_{ij}}.$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。