机器学习基本概念:数据集特征样本标签_样本、特征、标签-CSDN博客

用来训练模型的「全部数据合集」。

里面包含了所有样本、特征、标签。

例子：你收集了 1000条房屋的信息(面积、房间数、楼层) ，这 1000 条数据合起来就是数据集。

序号	面积 (㎡)	房间数	楼层	房价 (万)
1	80	2	5	160
2	100	3	10	220
…	…	…	…	…
1000	80	2	4	130

用来描述样本的「属性 / 信息」

例子：房屋的面积、房间数、楼层、……这些用来描述一个房屋的某列信息，都叫特征。

数据集中的 一条独立数据。

一行 = 一个样本

例子：第 1 个房屋信息：面积80平方米房间数 2 楼层5 房价160万

模型预测的「结果 / 答案」。

模型要学习去预测的目标

例子：判断房价：多少钱 → 标签

一句话总结