特征提取与神经网络基础解析

36、什么是特征提取?

特征提取是一种降维方法,它将信号或图像中的大量数值减少为更易于管理的特征数量,这些特征仍能准确捕捉原始数据。也就是说,我们的目标是从高维数据中提取新的显著特征并去除冗余信息,这样可以减少过拟合,提高机器学习模型的准确性和计算效率。

37、什么是形态特征?定义紧凑度、伸长率和平坦度。

形态特征

形态特征描述物体的几何方面,如:

  • 长度
  • 面积
  • 体积

可以包含的基本测量有:

  • 长度
  • 峰高
  • 面积
  • 最大直径
  • 表面积 A
  • 体积 V

紧密度

紧凑度 C 衡量体积的球形程度,公式为:

$$ C = \frac{36\pi V^2}{A^3} $$

在二维中,等效测量包含面积和周长的比率。

伸长率

伸长率用二维中短轴和长轴长度的比率来衡量。

平坦度

平坦度用三维中最小轴和长轴长度的比率来衡量。

38、描述使用单级二维离散小波变换和多分辨率一维离散小波变换得到的系数。

小波变换示例

单级二维离散小波变换

使用命令:

ca, (cdh, cdv, cdd) = pywt.dwt2(image, 'db1')

其中:

  • ca 是近似系数,代表数据的低分辨率版本;
  • cdh 是水平细节系数;
  • cdv 是垂直细节系数;
  • cdd 是对角细节系数,包含残差信息。

多分辨率一维离散小波变换

以 3 级为例,使用命令:

ca3, cd3, cd2, cd1 = wavedec(signal, 'db1', level=3)

多级离散小波变换会将当前级的近似系数进一步分解为下一个较低分辨率级的近似系数和细节系数:

  • ca3 是第 3 级的近似系数;
  • cd3 是第 3 级的细节系数;
  • cd2 是第 2 级的细节系数;
  • cd1 是第 1 级的细节系数。

39、列出不同类型的特征重要性,并描述它们是如何计算的。

特征重要性及计算方法

不同类型的特征重要性及计算方法如下:

1. 单变量特征重要性

衡量每个单独特征对目标值的预测能力,例如:

  • 皮尔逊相关系数
  • 特征 $x_k$ 与目标值 $y$ 之间的互信息

对于线性回归或分类器,在特征标准化后,多元线性模型($y = w_0 + w_1x_

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值