高斯过程(RapidMiner Studio Core)
概要
该操作员是高斯过程(GP)的实现,这是用于分类和回归的概率方法。描述
高斯过程是一个随机过程,其实现由与每个点(或空间)中每个点相关的随机值组成,因此每个这样的随机变量都有正态分布。此外,这些随机变量的每个有限集合都有多元正态分布。高斯过程在统计建模中很重要,因为从正常情况下继承了属性。例如,如果将随机过程建模为高斯过程,则可以明确获得各种派生数量的分布。这样的数量包括:多次范围内的过程的平均值;在一小时的时间内使用样本值估算平均值的误差。
高斯工艺(GPS)将多元高斯分布扩展到无限维度。正式地,高斯过程生成位于某些域中的数据,因此该范围的任何有限子集都遵循多元高斯分布。高斯流程是一种强大的非参数机器学习技术,用于构建现实世界问题的综合概率模型。leyu体育是真的吗它们可以应用于地统计学,监督,无监督和强化学习,主要组件分析,系统识别和控制,渲染音乐性能,优化和许多其他任务。
输入
- 训练集(数据表)
此输入端口期望一个示例集。该操作员无法处理名义属性;它可以应用于具有数字属性的数据集。因此,通常您可能必须在应用本操作员应用之前使用名义运算符。
输出
- 模型(内核模型)
应用高斯过程,并从此输出端口传递结果模型。现在,该模型可以应用于看不见的数据集。
- 示例集(数据表)
给出的作为输入的示例集将传递,而不会通过此端口更改输出。这通常用于在其他运算符中重复使用相同的示例集,或在结果工作区中查看示例集。
参数
- kernel_type内核函数的类型是通过此参数选择的。支持以下内核类型:RBF,Cauchy,Laplace,Poly,Sigmoid,Epanechnikov,Gaussian组合,多功能。范围:选择
- kernel_lengthscale此参数指定在所有内核中要使用的长度尺寸。范围:真实
- kernel_degree这是内核参数度。只有在内核类型参数设置为多项式或者Epachnenikov。范围:真实
- kernel_bias该参数指定要在多内核中使用的偏差。范围:真实
- kernel_sigma1这是内核参数Sigma1。只有在内核类型参数设置为Epachnenikov,,,,高斯组合或者多Quadric。范围:真实
- kernel_sigma2这是内核参数Sigma2。只有在内核类型参数设置为高斯组合。范围:真实
- kernel_sigma3这是内核参数Sigma3。只有在内核类型参数设置为高斯组合。范围:真实
- kernel_shift这是内核参数移位。只有在内核类型参数设置为多Quadric。范围:真实
- kernel_a这是内核参数a。只有在内核类型参数设置为乙状结肠范围:真实
- kernel_b这是内核参数b。只有在内核类型参数设置为乙状结肠范围:真实
- max_basis_vectors此参数指定要使用的最大基础向量数。范围:整数
- epsilon_tol该参数指定了伽马诱导的投影的公差。范围:真实
- GEOMETRICAL_TOL该参数指定了几何诱导的投影的公差。范围:真实
教程流程
高斯流程操作员简介
使用检索操作员加载“多项式”数据集。将拆分验证操作员应用于训练和测试回归模型。高斯流程运算符应用于拆分验证操作员的培训子过程。所有参数均与默认值一起使用。高斯流程运算符生成回归模型。应用模型操作员在测试子过程中使用该模型应用于测试数据集。性能操作员使用所得标记的示例集来测量模型的性能。回归模型及其性能向量已连接到输出,可以在结果工作区中看到。