逻辑回归-模型训练误差(H2O)
Shaila_Segal
成员职位:4贡献我
最佳答案
-
varunm1 主持人,职位:1207年独角兽你好@Shaila_Segal
我发现了问题所在。当您将属性类型从数字转换为二进制时,所有值都设置为FALSE,而不是将1设置为TRUE,将0设置为FALSE,反之亦然。你可以从截图中看到,所有1000个样本都被标记为FALSE。
原因是您在数字到二项式参数中选择的选项。为该属性选择的最小和最大值不正确。因此,如果您选择的最小值为0.0,最大值为1.0,则0.0和1.0之间的值(包括这两个)将表示为FALSE,其他值表示为TRUE。在您的示例中,由于标签属性(CHURN)中只有0或1,因此它将0和1都转换为FALSE。因此,为了避免这种错误,您需要选择范围为0.1和1.0,这样标签中的所有1将被转换为FALSE,所有0将被表示为TRUE。
您应该小心使用“数字到二名”,根据您的设置,它将根据此条件(>=0.1和<=1.0)将数据集中的所有整数属性转换为FALSE,其他所有属性转换为TRUE。
如果你只是想将“流失”属性转换为二名,你可以在属性过滤器类型中选择“单一”,在“属性”中选择“流失”属性,并确保将“最小值”更改为0.1。
7
答案
你能检查逻辑回归算子的输入吗?该错误表示逻辑回归运算符中只有一个标签。由于预测不能用一个标签完成,它可能会抛出一个错误。
您可以通过右键单击逻辑回归运算符并选择“断点之前”来检查输入。一旦你运行这个过程,你可以看到数据进入运算符,在统计中,你可以看到代表每个类样本数量的标签统计。
如果您想让我们检查,请通过FILE -> Export process向我们提供流程,并将.rmp文件附加在这里。也请提供数据给我们。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离