偏差的重量(RapidMiner Studio Core)
概要
该操作员根据属性的(归一化)标准偏差来计算给定示例集的属性的相关性。描述
偏差操作员的重量根据属性的(归一化)标准偏差计算属性相对于标签属性的重量。属性的重量越高,它被考虑的相关性越大。标准偏差可以按平均,最小或最大属性进行标准化。请注意,该操作员只能应用于带有数值标签的示例集。
标准偏差显示了平均值(平均值或期望值)的变化或分散量。低标准偏差表明数据点往往非常接近均值,而高标准偏差表示数据点在大量值范围内分布。标准偏差是衡量分数的衡量标准。公式很简单:它是方差的平方根。
输入
- 示例集(数据表)
此输入端口期望一个示例集。它是附件示例过程中检索操作员的输出。
输出
- 权重(属性重量)
此端口将相对于标签属性提供属性的权重。重量较高的属性被认为更相关。
- 示例集(数据表)
给出的作为输入的示例集将传递,而不会通过此端口更改输出。这通常用于在其他运算符中重复使用相同的示例集,或在结果工作区中查看示例集。
参数
- 归一化_weights此参数指示是否应将计算的权重标准化。如果设置为true,则所有权重均在0到1的范围内标准化。范围:布尔值
- sort_weights此参数指示属性是否应根据结果中的权重对其进行排序。如果此参数设置为true,则使用排序方向范围。范围:布尔值
- sort_direction此参数仅在排序重量参数设置为true。此参数根据其权重指定属性的排序顺序。范围:选择
- 归一化此参数指示标准偏差是否应除以属性的最小,最大或平均值。范围:选择
教程流程
计算多项式数据集的属性权重
使用检索操作员加载“多项式”数据集。这里插入一个断点,以便您可以查看示例集。您还可以在“统计”列中查看“统计”列中所有属性的标准偏差。该示例集将偏差操作员的重量应用于计算属性的权重。标准化权重参数设置为false,因此权重不会归一化。排序权重参数设置为true,排序方向参数设置为“上升”,因此结果将按权重的上升顺序。您可以通过在结果工作区中查看此过程的结果来验证这一点。您还可以看到这些权重与属性的标准偏差完全相同。