机器学习最强可视化降维：t-SNE 超通俗完整版

最新推荐文章于 2026-06-04 15:40:18 发布

原创最新推荐文章于 2026-06-04 15:40:18 发布 · 946 阅读

5 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#机器学习 #人工智能

【机器学习-深度学习】算法专栏收录该内容

112 篇文章

订阅专栏

机器学习最强可视化降维：t-SNE 超通俗完整版

在所有降维算法里，t-SNE 是画聚类图最厉害的一个。
不管数据多复杂、多扭曲，t-SNE 都能把相似的点聚在一起、不同类别分得清清楚楚，是机器学习、深度学习做特征可视化、聚类分析的“御用工具”。

这篇文章用大白话 + 原理拆解 + 可直接运行代码 + 参数调优 + 面试总结，把 t-SNE 讲得通俗易懂，本科生、研究生都能轻松掌握。

一、先看懂：t-SNE 到底是什么？

1. 一句话理解 t-SNE

t-SNE = 专门用来画高维数据聚类图的非线性降维算法
它只干一件事：
让相似的点靠得近，不相似的点离得远，画出来的图干净、漂亮、聚类明显。

2. 超通俗例子

你有一堆手写数字（0-9），每张图是 784 维。

PCA 画出来：数字挤在一起，分不清
t-SNE 画出来：同类数字紧紧抱团，不同数字分得很开

3. 最核心特点

只看“邻居关系”，不看全局距离
专门做可视化，几乎只用 2D/3D
聚类效果吊打 PCA、LDA、MDS

二、t-SNE 核心思想（极简版）

t-SNE 分两步走：

1. 在高维空间算“相似度”

用高斯分布，算出每个点和其他点像不像。
越像，概率越高；越不像，概率越低。

2. 在低维空间“摆位置”

用 t 分布来摆放点，通过不断优化，让：
低维相似度 ≈ 高维相似度

最后得到一张：
同类相聚、异类分离、颜值极高的图。

三、t-SNE 数学原理（看得懂版）

1. 高维相似度（概率 p_ij）

用高斯核衡量两点之间的相似程度：
$pj∣i=exp⁡(−∣∣xi−xj∣∣2/2σi2)∑k≠iexp⁡(−∣∣xi−xk∣∣2/2σi2)p_{j|i}=\frac{\exp(-||x_i-x_j||^2/2\sigma_i^2)}{\sum_{k\neq i}\exp(-||x_i-x_k||^2/2\sigma_i^2)}$
再对称化：
$pij=pj∣i+pi∣j2Np_{ij}=\frac{p_{j|i}+p_{i|j}}{2N}$

2. 低维相似度（概率 q_ij）

用 t 分布（长尾，能把不相似点推得更远）：
$qij=(1+∣∣yi−yj∣∣2)−1∑k≠l(1+∣∣yk−yl∣∣2)−1q_{ij}=\frac{(1+||y_i-y_j||^2)^{-1}}{\sum_{k\neq l}(1+||y_k-y_l||^2)^{-1}}$

3. 优化目标：KL 散度

让高维、低维分布尽量一样：
$C=∑i,jpijlog⁡pijqijC=\sum_{i,j}p_{ij}\log\frac{p_{ij}}{q_{ij}}$
用梯度下降不断迭代。

四、t-SNE 最重要参数：perplexity（困惑度）

perplexity 相当于“邻居数”
控制 t-SNE 更关注局部还是全局。

太小：聚成一团乱麻
太大：变成全局结构，聚类不明显
常用：5~50，图像常用 30

五、实战代码：MNIST 手写数字 t-SNE 可视化（可直接运行）

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import fetch_openml
from sklearn.preprocessing import StandardScaler
from openTSNE import TSNE  # 速度更快的 t-SNE
import time

# ====================== 1. 加载 MNIST 数据 ======================
print("加载数据中...")
mnist = fetch_openml('mnist_784', version=1, parser='auto')
X = mnist.data.astype(np.float32)
y = mnist.target

# 取少量数据加速（全量 7 万跑很久）
sample_idx = np.random.choice(len(X), 10000, replace=False)
X = X.iloc[sample_idx]
y = y.iloc[sample_idx]

# ====================== 2. 标准化 ======================
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# ====================== 3. t-SNE 降维 ======================
print("开始 t-SNE 降维...")
start = time.time()

tsne = TSNE(
    n_components=2,
    perplexity=30,
    learning_rate=200,
    n_iter=1000,
    n_jobs=-1,
    random_state=42
)

X_tsne = tsne.fit(X_scaled)
end = time.time()
print(f"完成！耗时：{end-start:.2f}s")

# ====================== 4. 画图 ======================
plt.figure(figsize=(14, 10))
sns.scatterplot(
    x=X_tsne[:, 0], y=X_tsne[:, 1],
    hue=y.astype(int),
    palette='bright',
    s=8,
    alpha=0.8
)
plt.title("t-SNE on MNIST 手写数字可视化", fontsize=16)
plt.legend(title='数字', bbox_to_anchor=(1, 1))
plt.tight_layout()
plt.show()