社区发现
louvain算法
1
Leiden算法
2
感觉和聚类算法很像。。。
聚类算法
KMeans受限于算法本身,对于球状的数据效果较好,但是不规则形状的就不行了。这种情况下,相对而言,基于密度的聚类算法就比较好用了。
DBSCAN
DBSCAN是一种基于密度的聚类算法,也就是说,密度高的区域自动聚成一类。这样一来,我们就避免了人为去设定群组数量的问题,算法可以自动发现群组数量。另外用这种方法,如果一个sample不在高密度区域,就有可能被判定为异常值,那么也可以拿来作为异常值检验的方法。
https://samaelchen.github.io/dbscan_and_optics/
https://help.supermap.com/iDesktopX/1101/zh/tutorial/SpecialFeatures/Analyst/SpatialStatisticalAnalysis/DensityBasedClustering
降维算法
常见的PCA
UMAP
降维不仅仅是为了数据可视化。它还可以识别高维空间中的关键结构并将它们保存在低维嵌入中来克服“维度诅咒”