【文献阅读笔记】Unsupervised Deep Embedding for Clustering Analysis

文章介绍了一种名为DeepEmbeddedClustering(DEC)的无监督学习方法,它利用深度神经网络同时学习特征空间和聚类分配。DEC通过迭代优化基于KL散度的目标函数,自动生成特征表示并改进聚类效果。这种方法在特征空间选择和聚类任务中提供了一种数据驱动的解决方案。

标题(paper):Unsupervised Deep Embedding for Clustering Analysis

期刊 + 时间 + 有无源代码: Proceedings of the 33 rd International Conference on Machine
Learning + 2016 + 没收集

作者: Junyuan Xie, Ross Girshick, Ali Farhadi

方法名及缩写: Deep Embedded Clustering
(DEC)

算法框架: 使用从当前软聚类分配中派生的辅助目标分布来迭代地改进聚类。这个过程逐步改进了聚类和特征表示。

DEC的工作原理是迭代优化基于KL散度的聚类目标和自训练目标分布。

流程图 : 在这里插入图片描述

DEC模型分为两个部分:(1)自编码器用于参数初始化;(2)参数优化(即聚类)。

主要创新点: 利用深度神经网络同时学习特征空间和分配聚类。

动机: 特征空间的选择通常作为应用程序特定的细节留给最终用户来决定。然而很明显,特征空间的选择是至关重要的;除了最简单的图像数据集,在原始像素上使用欧几里德距离聚类是完全无效的。在本文中,我们重新审视了聚类分析,并提出了一个问题:我们能否使用数据驱动的方法来共同解决特征空间和聚类隶属关系?

目标函数:

第一部分:自编码器作非线性映射:fθ:X→Zf_{\theta}:X\to Zfθ:XZ 其中θ\thetaθ是可以学习的参数,ZZZ潜在特征表示。

DEC:

(1)初始化参数θ\thetaθ{ μj}j=1k\{\mu_j\}^k_{j=1}{ μj}j=1kk个类的类中心点。

(2)利用KL散度进行聚类:

  • 第一步计算软聚类
    qij=(1+∥zi−μj∥2/α)−α+12∑j′(1+∥zi−μj′∥2/α)−α+12, q_{ij}=\frac{(1+\|z_i-\mu_j\|^2/\alpha)^{-\frac{\alpha+1}2}}{\sum_{j^{\prime}}(1+\|z_i-\mu_{j^{\prime}}\|^2/\alpha)^{-\frac{\alpha+1}2}}, qij=j(1+ziμj2/α)2α+1(1+ziμj2/α)2α+1,
    α\alphaα是Students t 分布的自由度(α=1\alpha=1α=1

    qijq_{ij}qij是样本iii被分配到第jjj个类的概率

  • KL 散度最小化
    L=KL(P∥Q)=∑i∑jpijlog⁡pijqij. L=\mathrm{KL}(P\|Q)=\sum_i\sum_jp_{ij}\log\frac{p_{ij}}{q_{ij}}. L=KL(PQ)=ijp

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值