如何使用自动模型的数据,我已经分成训练和测试?

kzhao25kzhao25 成员职位:1新手
我正在尝试用一个模型来预测少数类别(中风患者)来解决一个不平衡的二元分类问题。我对训练数据使用过采样来合成中风病例的实例,这样我就可以解决数据不平衡的问题。

然而,我将测试数据保留为正态不平衡分布,而不是过度采样,因为我想在现实世界的分布上测试我的模型。我想使用RapidMiner的自动模型功能,但每次我尝试使用它时,它只是将我的训练数据分割成另一个训练测试分割,并做自己的事情。

我如何使用自动模型,同时指定这些模型应该训练的数据和应该测试的数据?

答案

登录注册置评。