然后我们再来看一种聚类算法,叫做DBSCAN算法
可以看到,他和KMeans的原理完全不一样,
这个是基于密度的聚类方法,就是在一堆数据中,把密度最大的数据,归为一类
这里的划分为簇,其实就是 划分类别的意思 这个簇,就跟鱼群一样,一个鱼群中肯定是同一种鱼类.
然后我们再来看,DBSCAN算法的基本原理,可以看到
这里A点是核心点,我们以这个核心点进行画圆,在圆圈中的点,全部会被划分为一类对吧,然后我们再看
N这个点,这个点不在圆圈内,这个N点就是一个离群点
然后B,C这两个点,可以看到黄色的是边界点,在边界上,但是B,C这两个边界点也属于A这个圆划分的类
之前我们在做KMeans聚类的时候,我们说KMeans可以进行异常值检测对吧,
对异常值不友好,有个缺点就是,但是可以看到 在DBSCAN算法中,就自然就考虑到了异常值点对吧
可以看到上图中的蓝色的点.就算