- 主题:哪位大侠对聚类方法比较了解吗?指导下
-   
 一共300多个样本,分成A B C三类,
 每类数量至少10个以上时候,聚类结果比较准确。
 
 但是如果其中两类可能数量很少,
 比如A 只有1个, B只有1个,C将近300个,这种情况k均值聚类就结果不对。
 肉眼看三类数据分布,是很明显的区别。
 
 用什么招能解决下?
 --
 FROM 36.23.192.*
 
- 看看特征工程
 【 在 hitmanman 的大作中提到: 】
 : 一共300多个样本,分成A B C三类,
 : 每类数量至少10个以上时候,聚类结果比较准确。
 : 但是如果其中两类可能数量很少,
 : ...................
 --
 FROM 202.106.10.*
 
- 基于密度的聚类试试
 
 【 在 hitmanman (Adam) 的大作中提到: 】
 : 一共300多个样本,分成A B C三类,
 : 每类数量至少10个以上时候,聚类结果比较准确。
 : 但是如果其中两类可能数量很少,
 : ...................
 --
 FROM 182.92.253.*
 
- birch效果不错
 可以容忍1个得情况
 多谢哈哈
 【 在 Jangbi 的大作中提到: 】
 : 基于密度的聚类试试
 :
 --
 FROM 36.23.192.*
 
- 特征选择的问题。
 【 在 hitmanman 的大作中提到: 】
 : 一共300多个样本,分成A B C三类,
 : 每类数量至少10个以上时候,聚类结果比较准确。
 : 但是如果其中两类可能数量很少,
 : ...................
 --
 FROM 123.150.181.*
 
- 换一个聚类方法搞定了
 根据前面回复的启发
 
 谢谢大家
 【 在 wangychf 的大作中提到: 】
 : 特征选择的问题。
 --
 FROM 36.23.192.*
 
- 肉眼很清楚的聚类不是随便做么……  
 
 【 在 hitmanman (Adam) 的大作中提到: 】
 :
 :
 :  一共300多个样本,分成A B C三类,
 :  每类数量至少10个以上时候,聚类结果比较准确。
 --
 FROM 115.199.182.*
 
- 实际情况千差万别
 【 在 touzi 的大作中提到: 】
 : 肉眼很清楚的聚类不是随便做么……
 --
 FROM 115.205.166.*