优化权重(正向)(RapidMiner Studio Core)
剧情简介
该操作符通过计算属性权重来计算给定ExampleSet属性的相关性。该运算符假设属性是独立的,并通过线性搜索优化属性的权重。描述
优化权重(向前)操作符是一个嵌套操作符,即它有一个子进程。优化权重(转发)操作符的子流程必须始终返回一个性能向量。有关子流程的更多信息,请学习Subprocess操作符。Optimize Weights (Forward)操作符使用子流程返回的性能向量计算给定ExampleSet属性的权重。一个属性的权重越高,它就越被认为是相关的。
该算子在特征相互独立的朴素假设下执行加权。每个属性都用线性搜索加权。如果特征确实不是高度相关的,这种方法可以在短时间内提供良好的结果。
分化
优化权重(进化)
优化权重(进化)操作符通过使用进化方法计算给定ExampleSet属性的相关性。使用遗传算法计算属性的权重。输入
- 示例设置为(数据表)
这个输入端口需要一个ExampleSet。这个ExampleSet在嵌套链的第一个端口(在子流程中)可用,以便在子流程中进行处理。
- 通过(IOObject)
该操作符可以有多个直通端口。当一个输入与通过端口连接时,另一个通过端口可用,该端口准备接受另一个输入(如果有的话)。输入的顺序保持不变。在此操作符的第一个直通端口提供的Object在嵌套链的第一个直通端口(在子进程内)可用。不要忘记按正确顺序连接所有输入。确保在子进程级别连接了正确数量的端口。
输出
- 举例说明(数据表)
带有简化属性的最终exampleeset通过该端口交付。
- 权重(权重)
属性权重通过该端口下发。
- 性能(性能向量)
该端口为所选属性提供性能矢量。性能矢量是性能标准值的列表。
参数
- keep_best该参数指定每一代中要保留的最佳个体的数量。范围:整数
- generations_without_improval此参数指定提前停止的停止标准,即在之后停止n几代人的表现没有改善。n由此参数指定。范围:整数
- 权重此参数指定在每代中创建个体时使用的权重。范围:字符串
- normalize_weights该参数指示最终权重是否应该规范化。如果设置为true,则对最终权重进行规范化,使最大权重为1,最小权重为0。范围:布尔
- use_local_random_seed该参数表示a局部随机种子应该用于随机化。使用相同的值局部随机种子会产生相同的随机化。范围:布尔
- local_random_seed此参数指定局部随机种子.仅当使用当地的随机种子参数设置为true。范围:整数
- show_stop_dialog此参数确定具有停止按钮,停止搜索最佳特征空间。如果停止对最佳特征空间的搜索,则返回之前找到的最佳个体。范围:布尔
- user_result_individual_selection如果将此参数设置为true,则允许用户从上次填充中选择最终结果个体。范围:布尔
- show_population_plotter此参数确定是否应在性能空间中显示当前人口。范围:布尔
- plot_generations此参数仅在显示人口分布图参数设置为true。人口绘图仪在这几代中更新。范围:整数
- constraint_draw_range此参数仅在显示人口分布图参数设置为true。此参数决定是否将人口绘图仪的绘制范围限制在0到1之间。范围:布尔
- draw_dominated_points此参数仅在显示人口分布图参数设置为true。该参数决定是否只在总体绘图仪上绘制非帕累托支配的点。范围:布尔
- population_criteria_data_file此参数指定保存最终人口的标准数据的文件的路径。范围:文件名
- maximal_fitness此参数指定最大适应度。如果适应度达到这个值,优化将停止。范围:真正的
教程的过程
计算多项式数据集属性的权重
使用检索操作符加载“多项式”数据集。这里插入了一个断点,以便您可以查看ExampleSet。您可以看到,除了label属性之外,ExampleSet有5个常规属性。优化权重(向前)操作符应用于ExampleSet,这是一个嵌套的操作符,即它有一个子进程。子流程有必要交付一个性能向量。该性能向量由底层算法使用。看看这个操作符的子过程。这里使用了分割验证操作符,它本身就是一个嵌套操作符。看一下分割验证操作符的子流程。SVM算子在“Training”子过程中用于训练模型。 The trained model is applied using the Apply Model operator in the 'Testing' subprocess. The performance is measured through the Performance operator and the resultant performance vector is used by the underlying algorithm. Run the process and switch to the Results Workspace. You can see that the ExampleSet that had 5 attributes has now been reduced to 2 attributes. Also take a look at the weights of the attributes in the Results Workspace. You can see that two attributes have non-zero weight and the remaining attributes have weight 0.