相关向量机(RapidMiner Studio Core)
概要
该操作员是相关向量机(RVM)的实现,这是用于分类和回归的概率方法。描述
相关矢量机操作员是用于分类和回归的概率方法。相关向量机的实现基于“ Tipping/2001”描述的原始算法。如果有的话RVM类型参数设置为“构建性回归RVM”。
相关矢量机(RVM)是一种使用贝叶斯推理的机器学习技术,以获取用于回归和分类leyu体育是真的吗的简约解决方案。RVM与支持向量机具有相同的功能形式,但提供了概率分类。它实际上等同于具有一定协方差函数的高斯过程模型。与支持向量机(SVM)相比,RVM的贝叶斯公式避免了SVM的自由参数集(通常需要基于交叉验证的后拟合后)。但是,RVM使用期望最大化(EM)类似学习方法,因此有局部最小值的风险。这与SVMS使用的标准顺序最小优化(SMO)基于标准的顺序最小优化(SMO)不同,该算法保证可以找到全局最佳。
输入
- 训练集(数据表)
此输入端口期望一个示例集。该操作员无法处理名义属性;它可以应用于具有数字属性的数据集。因此,通常您可能必须在应用本操作员应用之前使用名义运算符。
输出
- 模型(内核模型)
应用RVM,并从此输出端口传递结果模型。现在,该模型可以应用于看不见的数据集。
- 示例集(数据表)
给出的作为输入的示例集将传递,而不会通过此端口更改输出。这通常用于在其他操作员中重复使用相同的示例集,或在结果工作区中查看示例集。
参数
- rvm_type此参数指定RVM回归的类型。可用以下选项:回归-RVM,分类-RVM和构建式回归RVM。范围:选择
- kernel_type内核函数的类型是通过此参数选择的。支持以下内核类型:RBF,考奇,拉普拉斯,poly,sigmoid,epanechnikov,高斯组合,多quadric范围:选择
- kernel_lengthscale此参数指定在所有内核中要使用的长度尺寸。范围:真实
- kernel_degree这是内核参数度。只有在内核类型参数设置为多项式或者Epachnenikov。范围:真实
- kernel_bias该参数指定要在多内核中使用的偏差。范围:真实
- kernel_sigma1这是内核参数Sigma1。只有在内核类型参数设置为Epachnenikov,,,,高斯组合或者多Quadric。范围:真实
- kernel_sigma2这是内核参数Sigma2。只有在内核类型参数设置为高斯组合。范围:真实
- kernel_sigma3这是内核参数Sigma3。只有在内核类型参数设置为高斯组合。范围:真实
- kernel_shift这是内核参数移位。只有在内核类型参数设置为多Quadric。范围:真实
- kernel_a这是内核参数a。只有在内核类型参数设置为乙状结肠范围:真实
- kernel_b这是内核参数b。只有在内核类型参数设置为乙状结肠范围:真实
- max_iteration此参数指定要使用的最大迭代次数。范围:整数
- min_delta_log_alpha如果最大的log alpha更改小于最小三角洲日志alpha。范围:真实
- alpha_max如果其alpha大于alpha max。范围:真实
- use_local_random_seed此参数指示是否局部随机种子应用于随机分组。使用相同的值局部随机种子将产生相同的随机化。范围:布尔值
- local_random_seed此参数指定局部随机种子。此参数仅在使用局部随机种子参数设置为true。范围:整数
教程流程
RVM操作员简介
使用检索操作员加载“多项式”数据集。将拆分验证操作员应用于训练和测试回归模型。相关矢量机操作员用于拆分验证操作员的培训子过程。所有参数均与默认值一起使用。相关矢量机操作员生成回归模型。应用模型操作员在测试子过程中使用该模型应用于测试数据集。性能操作员使用所得标记的示例集来测量模型的性能。回归模型及其性能向量已连接到输出,可以在结果工作区中看到。