关于线性回归模型输出的问题

akseleratorakselerator 成员职位:3.学我
嗨,RapidMiner社区
我尝试做一个线性回归模型,并尝试通过交叉验证来测试模型的性能。输出是一个线性函数:
- 31.472 *以公里计的距离+ 34850.105 * WTG数量+ 15042.279
这个模型在预测我想要的成本方面表现得很好。但是,交叉验证中预测列的输出与整体函数中的变量不匹配。如果我在函数中插入给定的距离和给定的WTG量,输出与预测(变量)不相同。

如果在第12行的输出函数中插入第一个值,距离为48,WTG数量为1,则输出为48,381.73。然而,该模型预测60651人。
有人知道交叉验证中的“预测”栏是如何工作的吗?当它根据所设置的变量进行预测时。为什么它与线性回归模型的结果不同?

提前感谢您花时间阅读我的问题。

亲切的问候
Aksel

最佳答案

  • lionelderkrikorlionelderkrikor 版主,RapidMiner认证分析师,会员职位:1195年独角兽
    解决方案接受
    @akselerator

    这是因为在10次交叉验证过程中,RapidMiner会对每一次数据生成10个不同的模型。
    然而,输出时交付的模型是用整个数据集构建的。
    因此,每个交叉验证褶皱的模型都不同于“生产”模型(您所示的方程)。
    这就是为什么你不能用“生产模型”的方程来检索交叉验证的一个或几个模型的预测。

    我希望是清楚的

    问候,

    莱昂内尔

    akselerator

答案

登录注册置评。