类别

版本

偏差的重量(RapidMiner Studio Core)

概要

该操作员根据属性的(归一化)标准偏差来计算给定示例集的属性的相关性。

描述

偏差操作员的重量根据属性的(归一化)标准偏差计算属性相对于标签属性的重量。属性的重量越高,它被考虑的相关性越大。标准偏差可以按平均,最小或最大属性进行标准化。请注意,该操作员只能应用于带有数值标签的示例集。

标准偏差显示了平均值(平均值或期望值)的变化或分散量。低标准偏差表明数据点往往非常接近均值,而高标准偏差表示数据点在大量值范围内分布。标准偏差是衡量分数的衡量标准。公式很简单:它是方差的平方根。

输入

  • 示例集(数据表)

    此输入端口期望一个示例集。它是附件示例过程中检索操作员的输出。

输出

  • 权重(属性重量)

    此端口将相对于标签属性提供属性的权重。重量较高的属性被认为更相关。

  • 示例集(数据表)

    给出的作为输入的示例集将传递,而不会通过此端口更改输出。这通常用于在其他运算符中重复使用相同的示例集,或在结果工作区中查看示例集。

参数

  • 归一化_weights此参数指示是否应将计算的权重标准化。如果设置为true,则所有权重均在0到1的范围内标准化。范围:布尔值
  • sort_weights此参数指示属性是否应根据结果中的权重对其进行排序。如果此参数设置为true,则使用排序方向范围。范围:布尔值
  • sort_direction此参数仅在排序重量参数设置为true。此参数根据其权重指定属性的排序顺序。范围:选择
  • 归一化此参数指示标准偏差是否应除以属性的最小,最大或平均值。范围:选择

教程流程

计算多项式数据集的属性权重

使用检索操作员加载“多项式”数据集。这里插入一个断点,以便您可以查看示例集。您还可以在“统计”列中查看“统计”列中所有属性的标准偏差。该示例集将偏差操作员的重量应用于计算属性的权重。标准化权重参数设置为false,因此权重不会归一化。排序权重参数设置为true,排序方向参数设置为“上升”,因此结果将按权重的上升顺序。您可以通过在结果工作区中查看此过程的结果来验证这一点。您还可以看到这些权重与属性的标准偏差完全相同。