逻辑回归-模型训练错误(H2) NullPointerException
我有一个带有二项结果变量的模型。我使用决策树来构建它,但我想尝试一些其他的模型类型。逻辑回归显然是下一个选择,但当我运行它时,我得到:模型训练误差(H2O)。训练H2O模型时出错。请检查您的输入数据和参数设置。
这个过程相对简单——在选择一个均匀的样本之后,我有一个优化选择(进化)节点,其中是一个验证节点,其中是逻辑回归节点。输入数据是数字(整数、实数、数值)和多项式数据的混合,没有丢失数据。有很多属性(253),但只有1486条记录。优化选择的目的是减少这种情况。(决策树使用了其中4个变量。)
对于这个错误意味着什么或者哪里出了问题,有什么见解吗?是否有一个日志文件的地方,我需要看?
1
答案
你能发布这个过程的XML吗?
如果可能且不保密,甚至可以提供导致此错误的数据样本?如果你愿意,我们也可以通过私信来解决。我们最近改变了逻辑回归模型的基本行为,尽管我们进行了测试,但可能总是有一些我们自己没有捕捉到的数据细节……
谢谢,
Ingo
很乐意帮忙!我在Mac上运行7.2(刚刚安装了这个am),我已经匿名化了数据,可以通过PM分享(我对你的团队访问它没有问题,但如果它要进入野外,可能会有一个问题。)同时,附带了一个简化的XML,用于读取我将共享的数据的CSV(这是后ETL内容)。误差没有变化,所以它没有出现在这些混乱中。
太好了,谢谢你的帮助。当然,我们会对这些数据保密,并会对此进行调查。我们的工程师会随时向您通报进展情况。
再次感谢,
Ingo
你好再次,
如果我取消选择"计算p值"就能让你的进程运行。所以,如果你现在不需要它们,这至少是一个解决方案,直到我们发布补丁…
最好的
Ingo
谢谢英戈-这工作作为一个临时解决方案,而我正在开发模型。我期待着补丁!
你好,
只是一个快速的更新:我们现在正在做这个,一旦我们知道什么时候会发布补丁,我们就会回来。
最好的
Ingo
你好,
这里是更新:Studio 7.3版本修复了这个错误。
对于早期版本,解决方法是禁用“计算p值”。
版本中的修复实际上做了类似的事情:当一个或多个常规属性中有太多(比如几千个)不同的标称值时,禁用p值计算。拥有这样的规则属性实际上可能表明在训练之前需要进行一些特征选择/工程,即使算法可以处理这样的输入。
最好的
彼得