聚类大小和质心表之间有什么关系?哪种模式更有意义?为什么?

NatalySimthNatalySimth 成员职位:8因素二世
你好各位,

我正在比较两个结果,如下所示:

我的问题是:聚类大小和质心表之间是什么关系?哪种模式更有意义?为什么?
(Case1):



(例2):

标记:
Tghadially Jasmine_

最佳答案

答案

  • lionelderkrikorlionelderkrikor 版主,RapidMiner认证分析师,会员职位:1194年独角兽
    2019年10月编辑
    @NatalySimth

    没有任何额外的信息,有一个大致的概念,你可以计算质心距离内平均它衡量集群的“容量”。(比较两种模型)。
    对于这个,你需要写一个性能(集群距离性能)在您的流程末尾的操作符。

    编辑:
    我想更正/完善上面的解释:
    假设您使用的是k -means算法,一种寻找最佳k(聚类数量)的方法,也就是根据“k”绘制“质心距离内平均值”,从而得到最佳模型。你会得到这样的曲线(或者相反的方向,因为在RapidMiner中质心距离内的平均值是负的):



    最佳k,也就是更相关的模型与曲线的拐点相匹配。

    希望这有助于


    问候,

    莱昂内尔
    sgenzer varunm1 Jasmine_
  • NatalySimthNatalySimth 成员职位:8因素二世
    lionelderkrikor谢谢你的解释。请允许我问一下,集群的“容量”是什么意思?

    如何创建性能和肘?对所有这些方法来说仍然是新的。
    Jasmine_
  • NatalySimthNatalySimth 成员职位:8因素二世
    @lionelderkrikor由于一百万年!:)如此有用的信息。
    lionelderkrikor varunm1 Jasmine_
  • lionelderkrikorlionelderkrikor 版主,RapidMiner认证分析师,会员职位:1194年独角兽
    @NatalySimth

    欢迎你!

    问候,

    莱昂内尔
    NatalySimth Jasmine_
  • Muhammed_Fatih_Muhammed_Fatih_ 成员职位:93Maven
    @lionelderkrikor

    感谢你从上面给出的鼓舞人心的答案!从这个意义上说,也应该可以通过使用戴维斯-博尔丁指数来生成埃尔博指数以便比较主要标准,对吧?

    提前感谢您的回答!

    的问候!
    Jasmine_
  • tonyboy9tonyboy9 成员职位:101因素二世
    更好的方法是,只返回davis - bouldin指数到autommodelk -means的结果。有人知道为什么这个结果被删除了吗?我的意思是解释k均值结果已经是一个挑战了。
  • prashant768prashant768 成员职位:5学我
    lionelderkrikor谢谢你的解释。

    但是你能否让我知道你是如何在rapidminer中得到惯性图的,因为它的选项只有质心和DB中的平均值。

    我想根据惯性准则画出它。请帮助
登录注册置评。