标题(paper):Unsupervised Deep Embedding for Clustering Analysis
期刊 + 时间 + 有无源代码: Proceedings of the 33 rd International Conference on Machine
Learning + 2016 + 没收集
作者: Junyuan Xie, Ross Girshick, Ali Farhadi
方法名及缩写: Deep Embedded Clustering
(DEC)
算法框架: 使用从当前软聚类分配中派生的辅助目标分布来迭代地改进聚类。这个过程逐步改进了聚类和特征表示。
DEC的工作原理是迭代优化基于KL散度的聚类目标和自训练目标分布。
流程图 : 
DEC模型分为两个部分:(1)自编码器用于参数初始化;(2)参数优化(即聚类)。
主要创新点: 利用深度神经网络同时学习特征空间和分配聚类。
动机: 特征空间的选择通常作为应用程序特定的细节留给最终用户来决定。然而很明显,特征空间的选择是至关重要的;除了最简单的图像数据集,在原始像素上使用欧几里德距离聚类是完全无效的。在本文中,我们重新审视了聚类分析,并提出了一个问题:我们能否使用数据驱动的方法来共同解决特征空间和聚类隶属关系?
目标函数:
第一部分:自编码器作非线性映射:fθ:X→Zf_{\theta}:X\to Zfθ:X→Z 其中θ\thetaθ是可以学习的参数,ZZZ潜在特征表示。
DEC:
(1)初始化参数θ\thetaθ和{ μj}j=1k\{\mu_j\}^k_{j=1}{ μj}j=1kk个类的类中心点。
(2)利用KL散度进行聚类:
-
第一步计算软聚类
qij=(1+∥zi−μj∥2/α)−α+12∑j′(1+∥zi−μj′∥2/α)−α+12, q_{ij}=\frac{(1+\|z_i-\mu_j\|^2/\alpha)^{-\frac{\alpha+1}2}}{\sum_{j^{\prime}}(1+\|z_i-\mu_{j^{\prime}}\|^2/\alpha)^{-\frac{\alpha+1}2}}, qij=∑j′(1+∥zi−μj′∥2/α)−2α+1(1+∥zi−μj∥2/α)−2α+1,
α\alphaα是Students t 分布的自由度(α=1\alpha=1α=1)qijq_{ij}qij是样本iii被分配到第jjj个类的概率
-
KL 散度最小化
L=KL(P∥Q)=∑i∑jpijlogpijqij. L=\mathrm{KL}(P\|Q)=\sum_i\sum_jp_{ij}\log\frac{p_{ij}}{q_{ij}}. L=KL(P∥Q)=i∑j∑p

文章介绍了一种名为DeepEmbeddedClustering(DEC)的无监督学习方法,它利用深度神经网络同时学习特征空间和聚类分配。DEC通过迭代优化基于KL散度的目标函数,自动生成特征表示并改进聚类效果。这种方法在特征空间选择和聚类任务中提供了一种数据驱动的解决方案。

727

被折叠的 条评论
为什么被折叠?



