kmeans
kmeans:
- 从每个集群中选取 K 个数据点作为质心(centroids)。
- 将每一个数据点与距离自己最近的质心划分在同一集群,即生成 K 个新集群。
- 找出新集群的质心,这样就有了新的质心。
DBSCAN
决策树:
决策树是一种基本的分类与回归方法,是最经常使用的数据挖掘算法之一。
决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是 if-else 规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。
决策树学习通常包括 3 个步骤:特征选择、决策树的生成和决策树的修剪。
残差
残差是指观测值与预测值之间的差异,在机器学习中用于评估模型的预测准确性。