构件模型权重(RapidMiner工作室核心)
剧情简介
该操作符通过使用由操作符(如PCA、GHA或ICA)创建的组件来创建ExampleSet的属性权重。如果给这个算子的模型是PCA,那么这个算子的行为就完全像PCA算子的权重。描述
权重组件模型操作符总是在操作符之后,如PCA, GHA或ICA。由这些操作符生成的ExampleSet和预处理模型连接到ExampleSet而且模型组件模型权重操作符的端口。权重组件模型操作符然后使用由前一个操作符(例如PCA、GHA、ICA等)创建的组件生成原始示例集的属性权重。组件由组件数量参数。如果正常体重参数未设置为true时,所选组件的确切值将用作属性权重。的正常体重参数通常设置为true,以便将权重分散在0和1之间。
属性权重反映了属性相对于类属性的相关性。一个属性的权重越高,它被认为越相关。
输入
- 榜样(数据表)
这个输入端口需要一个ExampleSet。它是附件示例过程中PCA运算符的输出。
- 模型(模型)
这个输入端口需要一个模型。这里通常提供由PCA、GHA或ICA等算子生成的预处理模型。
输出
- 权重(权重)
这个端口提供属性相对于标签属性的权重。权重越高的属性被认为越相关。
- 榜样(数据表)
通过此端口传递作为输入的ExampleSet而不更改为输出。这通常用于在进一步的操作符中重用相同的ExampleSet,或者在结果工作区中查看ExampleSet。
- 模型(模型)
通过此端口传递作为输入的模型而不更改为输出。
参数
- normalize_weights该参数指示计算的权重是否应该标准化。如果设置为true,则所有权重都在0到1的范围内标准化。范围:布尔
- sort_weights此参数指示是否应该根据属性在结果中的权重对其进行排序。如果将此参数设置为true,则使用排序方向参数。范围:布尔
- sort_direction该参数仅在排序权重参数设置为true。该参数根据属性的权重指定属性的排序顺序。选择范围:
- component_number该参数指定应该用作属性权重的组件的数量。范围:整数
教程的过程
用PCA方法计算声纳数据集的属性权重
'Sonar'数据集使用Retrieve操作符加载。对其应用PCA算子。降维参数设置为“none”。这里插入一个断点,以便您可以查看由PCA操作符创建的组件。看看由PCA运算符特别是“PC1”生成的特征向量,因为它将通过使用组件模型权重运算符用作权重。接下来应用组件模型权重操作符。PCA运算符的exampleeset和Model端口通过Component Model运算符连接到Weight对应的端口。归一化权重和排序权重参数被设置为false,因此所有权重都将与所选组件完全相同。组件编号参数被设置为1,因此'PC1'将被用作属性权重。权重可以在Results Workspace中看到。 You can see that these weights are exactly the same as the values of 'PC1'.
在第二个算子链中,权重由PCA算子应用于'Sonar'数据集。PCA算子权值的参数设置与分量模型权值的参数设置完全相同。在Results Workspace中可以看到,这里生成了完全相同的权重。