机器学习基本概念:数据集 特征 样本 标签

数据集(Dataset)

用来训练模型的「全部数据合集」。

里面包含了所有样本、特征、标签。

例子:你收集了 1000条 房屋的信息(面积、房间数、楼层) ,这 1000 条数据合起来就是数据集

序号面积 (㎡)房间数楼层房价 (万)
18025160
2100310220
10008024130

特征(Feature)

用来描述样本的「属性 / 信息」

例子:房屋的   面积、房间数、楼层、……这些用来描述一个 房屋  的 某列 信息,都叫特征

样本(Sample)

数据集中的 一条独立数据 。

一行 = 一个样本

例子:第 1 个房屋信息:面积80平方米  房间数 2  楼层5    房价160万

标签(Label)

模型预测的「结果 / 答案」。

模型要学习去预测的目标

例子:判断房价:多少钱 → 标签

一句话总结

  • 数据集:模型训练的所有数据
  • 样本:输入模型的数据
  • 特征:用来区分不同样本
  • 标签:模型要预测的结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值