类别

版本

相关向量机(RapidMiner Studio Core)

概要

该操作员是相关向量机(RVM)的实现,这是用于分类和回归的概率方法。

描述

相关矢量机操作员是用于分类和回归的概率方法。相关向量机的实现基于“ Tipping/2001”描述的原始算法。如果有的话RVM类型参数设置为“构建性回归RVM”。

相关矢量机(RVM)是一种使用贝叶斯推理的机器学习技术,以获取用于回归和分类leyu体育是真的吗的简约解决方案。RVM与支持向量机具有相同的功能形式,但提供了概率分类。它实际上等同于具有一定协方差函数的高斯过程模型。与支持向量机(SVM)相比,RVM的贝叶斯公式避免了SVM的自由参数集(通常需要基于交叉验证的后拟合后)。但是,RVM使用期望最大化(EM)类似学习方法,因此有局部最小值的风险。这与SVMS使用的标准顺序最小优化(SMO)基于标准的顺序最小优化(SMO)不同,该算法保证可以找到全局最佳。

输入

  • 训练集(数据表)

    此输入端口期望一个示例集。该操作员无法处理名义属性;它可以应用于具有数字属性的数据集。因此,通常您可能必须在应用本操作员应用之前使用名义运算符。

输出

  • 模型(内核模型)

    应用RVM,并从此输出端口传递结果模型。现在,该模型可以应用于看不见的数据集。

  • 示例集(数据表)

    给出的作为输入的示例集将传递,而不会通过此端口更改输出。这通常用于在其他操作员中重复使用相同的示例集,或在结果工作区中查看示例集。

参数

  • rvm_type此参数指定RVM回归的类型。可用以下选项:回归-RVM,分类-RVM和构建式回归RVM。范围:选择
  • kernel_type内核函数的类型是通过此参数选择的。支持以下内核类型:RBF,考奇,拉普拉斯,poly,sigmoid,epanechnikov,高斯组合,多quadric范围:选择
  • kernel_lengthscale此参数指定在所有内核中要使用的长度尺寸。范围:真实
  • kernel_degree这是内核参数度。只有在内核类型参数设置为多项式或者Epachnenikov范围:真实
  • kernel_bias该参数指定要在多内核中使用的偏差。范围:真实
  • kernel_sigma1这是内核参数Sigma1。只有在内核类型参数设置为Epachnenikov,,,,高斯组合或者多Quadric。范围:真实
  • kernel_sigma2这是内核参数Sigma2。只有在内核类型参数设置为高斯组合范围:真实
  • kernel_sigma3这是内核参数Sigma3。只有在内核类型参数设置为高斯组合范围:真实
  • kernel_shift这是内核参数移位。只有在内核类型参数设置为多Quadric范围:真实
  • kernel_a这是内核参数a。只有在内核类型参数设置为乙状结肠范围:真实
  • kernel_b这是内核参数b。只有在内核类型参数设置为乙状结肠范围:真实
  • max_iteration此参数指定要使用的最大迭代次数。范围:整数
  • min_delta_log_alpha如果最大的log alpha更改小于最小三角洲日志alpha范围:真实
  • alpha_max如果其alpha大于alpha max范围:真实
  • use_local_random_seed此参数指示是否局部随机种子应用于随机分组。使用相同的值局部随机种子将产生相同的随机化。范围:布尔值
  • local_random_seed此参数指定局部随机种子。此参数仅在使用局部随机种子参数设置为true。范围:整数

教程流程

RVM操作员简介

使用检索操作员加载“多项式”数据集。将拆分验证操作员应用于训练和测试回归模型。相关矢量机操作员用于拆分验证操作员的培训子过程。所有参数均与默认值一起使用。相关矢量机操作员生成回归模型。应用模型操作员在测试子过程中使用该模型应用于测试数据集。性能操作员使用所得标记的示例集来测量模型的性能。回归模型及其性能向量已连接到输出,可以在结果工作区中看到。