注意:如果你想报告一个新的错误,请张贴一个新的问题和标签为“错误报告”。谢谢你!
在《快速矿工Go》中,线性回归算法使用了一些我没有选择的输入。
我希望以前没有人问过我的问题。简而言之,RapidMiner Go似乎在用我没有选择的变量运行回归。一个解释。在Rapid Miner Go中,我删除了一个64列和近2900行的csv文件。我想要使用线性回归和决策树(“容易解释”)预测单个列(数字)。前两列是日期和时间。其他列是数字。我只选择了5个输入,那一页上的一个指示器说5个被选中了。我运行了回归,在Data Metrics中,它报告了我选择的5个输入和其他7个我没有选择的输入的相关性。假设它用我没有选择的7个输入来运行回归我怎么用我选择的5个输入来运行回归呢? Thanks very much. Regards, Bill
1
评论
你能交叉检查模型是否建立在你所选择的基础之上吗?您可以在模型执行后单击模型链接,然后向下滚动查看有多少带有系数的属性。
系数检查:
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
在Rapidminer Go中,一旦单击模型链接,如前所述。你在右上角有一个叫“导出”的选项。如果你点击它,你会看到一个叫做“下载过程”的选项。你能下载那个过程文件并附上这里检查吗?
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
谢谢分享。我会看一看,如果可能的话,也试着在这里或在私人信息中分享你的数据,这样我就可以重新运行并向你解释他的现象的原因。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
没问题,让我们继续讨论这个问题,因为我想让RM的朋友检查这个问题,也许可以开一张票来解决这个逗号问题。我不确定是否已经有一个说明说,我们不能在属性名中使用逗号,但将等待这个问题得到解决,这样就不会有未来的问题。
@sgenzer在这里输入吗?
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
为了重复这个错误,请将这个CSV文件上传到RapidMiner GO,并选择“角度”作为预测变量和下图中的属性(其中没有逗号),在下一个窗口中使用默认选择,easy Interpretable和所有剩下的默认选择,并运行分析。
一旦分析完成,我们可以观察到GLM模型也使用了未选择的属性,如下所示。
观察到的原因与属性名中存在“,”逗号有关。我的理解是REGEX函数出现在加载和处理数据——>删除列模块被此逗号值欺骗。从属性名中删除逗号后,我就看不到这一点了。另外,如果属性名中有逗号,则自动模型中不会发生这种情况。
我不确定是否有说明在属性名中不使用逗号。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离