方差分析矩阵(RapidMiner Studio Core)
概要
该操作员根据所有名义属性定义的组对所有数值属性进行ANOVA显着性测试。ANOVA是一种通用技术,可用于检验以下假设:在假设采样种群正态分布的假设下,两个或多个组之间的平均值是相等的。描述
方差分析(ANOVA)是一个统计模型,其中特定变量中观察到的方差被划分为可归因于不同变化源的组件。以最简单的形式,方差分析提供了统计检验,以了解几个组的平均值是否相等,因此将t检验推广到两组以上。进行多个两样本t检验将导致犯下I型错误的机会增加。因此,方差分析可用于比较两种,三个或更多手段。“假阳性”或I型错误被定义为当拒绝零假设的决定实际上是正确的,不应被拒绝的可能性。在ANOVA的典型应用中,零假设是所有组只是同一人群的随机样本。这意味着所有疗法都具有相同的作用(也许没有)。拒绝零假设意味着不同的治疗导致影响改变。
分化
分组方差分析
分组的ANOVA操作员基于用户指定属性(名义)定义的组对用户指定的ANOVA属性(数值)执行ANOVA显着性测试。输入
- 示例集(数据表)
此输入端口期望一个示例集。它是附件示例过程中检索操作员的输出。其他操作员的输出也可以用作输入。示例集应具有名义和数值属性,因为该操作员根据所有名义属性定义的组对所有数值属性进行ANOVA显着性测试。
输出
- 示例集(数据表)
给出的作为输入的示例集将传递,而不会通过此端口更改输出。这通常用于在其他运算符中重复使用相同的示例集,或在结果工作区中查看示例集。
- 方差分析(方差分析矩阵)
所有数值属性的ANOVA显着性测试都是根据所有名义属性定义的组执行的。结果ANOVA矩阵从该端口返回。
参数
- 显着性_level该参数指定ANOVA计算的显着性水平。范围:真实
- 唯一_固定该参数指示仅应使用聚集属性的不同值的行用于计算聚合函数。范围:布尔值
教程流程
高尔夫数据集的方差分析矩阵
使用检索操作员加载“高尔夫”数据集。在此处插入断点,以便您可以查看示例集。您可以看到示例集具有名义和数值属性。ANOVA矩阵操作员已应用于此示例集。该操作员根据所有名义属性定义的组对所有数值属性进行ANOVA显着性测试。可以在结果工作区中查看结果方差分析矩阵。