36、什么是特征提取?
特征提取是一种降维方法,它将信号或图像中的大量数值减少为更易于管理的特征数量,这些特征仍能准确捕捉原始数据。也就是说,我们的目标是从高维数据中提取新的显著特征并去除冗余信息,这样可以减少过拟合,提高机器学习模型的准确性和计算效率。
37、什么是形态特征?定义紧凑度、伸长率和平坦度。
形态特征
形态特征描述物体的几何方面,如:
- 长度
- 面积
- 体积
可以包含的基本测量有:
- 长度
- 峰高
- 面积
- 最大直径
- 表面积 A
- 体积 V
紧密度
紧凑度 C 衡量体积的球形程度,公式为:
$$ C = \frac{36\pi V^2}{A^3} $$
在二维中,等效测量包含面积和周长的比率。
伸长率
伸长率用二维中短轴和长轴长度的比率来衡量。
平坦度
平坦度用三维中最小轴和长轴长度的比率来衡量。
38、描述使用单级二维离散小波变换和多分辨率一维离散小波变换得到的系数。
小波变换示例
单级二维离散小波变换
使用命令:
ca, (cdh, cdv, cdd) = pywt.dwt2(image, 'db1')
其中:
-
ca是近似系数,代表数据的低分辨率版本; -
cdh是水平细节系数; -
cdv是垂直细节系数; -
cdd是对角细节系数,包含残差信息。
多分辨率一维离散小波变换
以 3 级为例,使用命令:
ca3, cd3, cd2, cd1 = wavedec(signal, 'db1', level=3)
多级离散小波变换会将当前级的近似系数进一步分解为下一个较低分辨率级的近似系数和细节系数:
-
ca3是第 3 级的近似系数; -
cd3是第 3 级的细节系数; -
cd2是第 2 级的细节系数; -
cd1是第 1 级的细节系数。
39、列出不同类型的特征重要性,并描述它们是如何计算的。
特征重要性及计算方法
不同类型的特征重要性及计算方法如下:
1. 单变量特征重要性
衡量每个单独特征对目标值的预测能力,例如:
- 皮尔逊相关系数
- 特征 $x_k$ 与目标值 $y$ 之间的互信息
对于线性回归或分类器,在特征标准化后,多元线性模型($y = w_0 + w_1x_


5374

被折叠的 条评论
为什么被折叠?



