24、时间序列聚类:k-Shape、k-Means与HDBSCAN算法对比

时间序列聚类:k-Shape、k-Means与HDBSCAN算法对比

1. k-Shape算法简介

k-Shape算法是一种强大的时间序列聚类算法,它使用归一化的互相关来计算聚类中心,并在每次迭代中更新时间序列到这些聚类的分配。该算法具有以下特点:
- 尺度和位移不变性 :不受数据尺度和位移的影响。
- 领域无关性 :可应用于多个领域。
- 可扩展性 :迭代细化过程的复杂度与序列数量呈线性关系,且所需参数调整极少。

k-Shape与k-Means算法类似,都采用迭代方法根据数据与最近聚类中心的距离将数据分配到不同组。但关键区别在于k-Shape使用基于形状的距离计算方法,该方法依赖于互相关。

2. 使用k-Shape对ECGFiveDays数据集进行时间序列聚类
2.1 数据准备

我们将使用UCR时间序列集合中的数据,由于文件大小超过100MB,需从UCR时间序列网站下载。该集合是最大的带类标签的时间序列数据集公共集合,共包含85个数据集,来自多个领域,可用于测试模型在不同领域的性能。每个时间序列仅属于一个类,可用于验证聚类结果。

首先,加载必要的库:

'''Main'''
import numpy as np
import pandas as pd
import os, time, re
import pickle, gzip, datetime
from os import listdi
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值