Skip to main content

kmeans

kmeans:

  1. 从每个集群中选取 K 个数据点作为质心(centroids)。
  2. 将每一个数据点与距离自己最近的质心划分在同一集群,即生成 K 个新集群。
  3. 找出新集群的质心,这样就有了新的质心。

DBSCAN

决策树:

决策树是一种基本的分类与回归方法,是最经常使用的数据挖掘算法之一。

决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是 if-else 规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。

决策树学习通常包括 3 个步骤:特征选择、决策树的生成和决策树的修剪。

残差

残差是指观测值与预测值之间的差异,在机器学习中用于评估模型的预测准确性。