个人模范表现

ThiruThiru 成员职位:One hundred.大师
2020年4月编辑 帮助
我使用adaboost + KNN为我的数据,这给77.24的性能准确性。&精密,回忆。
Adaboost配置了10次迭代。
有什么方法可以查看模型在每次迭代中的性能和在后续迭代中分配的权重吗
在rapidminer吗?
请让我知道。谢谢

登记
thiru
标记:

最佳答案

  • varunm1varunm1 主持人,职位:1207年独角兽
    2020年4月编辑 解决方案接受
    你好@Thiru

    1.Adaboost将尝试改进算法,通过在每次迭代中提取错误分类的样本来构建分类器。所以,这在训练方面是有效的。这个训练的结果是一个决策树的集合,这些决策树被应用在测试数据上,以检查训练后的算法执行得如何。Adaboost_1到10是训练表现,你可以看到训练模型在改进。但测试性能只有67,这意味着您仍然需要调整参数,否则模型是过拟合。

    2.是的,如果连接了验证操作符的“mod”端口,就会有20个。这样做的原因是,当验证操作符的“mod”端口连接到任何其他操作符或结果时,拆分操作符会运行两次训练端。一次是对70% (70:30 Split)的数据(训练数据)进行训练,另一次是验证完成后对整个数据进行训练。为了避免这种情况,只需删除验证操作符的“mod”端口之间的连接。如果你想用它来区分,很简单,前10次表现与70%的训练数据有关,11 - 20次表现与整个数据有关。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施,保持社交距离

    lionelderkrikor Thiru

答案

  • varunm1varunm1 主持人,职位:1207年独角兽
    你好@Thiru

    这就是你要找的吗?图像在Adaboost操作符内部,我们正在计算Training性能,并使用“Store”操作符将其存储在每次迭代中。存储操作符使用的命名约定是“Adaboost_%{execution_count}”。宏%{execution_count}将有助于在每次迭代时存储性能。我不确定我们是否可以提取AdaBoost的权重。



    请让我们知道这是否有帮助
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施,保持社交距离

  • ThiruThiru 成员职位:One hundred.大师
    你好@varunm1

    谢谢你的回复。你能详细说明一下如何使用“存储”+“宏”来获得性能吗
    在每个迭代。我对rapidminer比较陌生。在这个过程中,我尝试了set/generate宏操作符,但是
    它没有帮助。等待你的回复。谢谢你!
  • varunm1varunm1 主持人,职位:1207年独角兽
    (电子邮件保护)

    您不需要生成宏。有预定义的宏,在本例中,我在存储操作符中使用了%{execution_count}宏名。这样做的原因是,Adaboost迭代了10次,这意味着你可以得到10次训练表现。因为您需要所有这10种性能,所以您需要保存一个动态名称,该名称将在每次迭代之后更新。为此,我使用“Adaboost_%{execution_count}”作为存储性能的名称。%{execution_count}将计算特定操作符执行的次数,因为存储操作符位于AdaBoost内部,它将迭代10次,并将性能命名为Adaboost_1, Adaboost_2, Adaboost_3,…

    请查收附件中的.rmp文件。将它导入RM并在Adaboost操作符内部检查。

    adaboost.rmp 9.4 k
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施,保持社交距离

    lionelderkrikor
  • ThiruThiru 成员职位:One hundred.大师
    你好@varunm1,谢谢你的回复。在那里我可以看到所有10种型号的性能。你的意思是验证操作符的输出?我们正在获取案例adaboost +决策树作为您使用的案例。如果我使用adaboost + KNN -我无法查看所有的10个模型。你能帮我看看这个吗?谢谢

    登记
    thiru
  • varunm1varunm1 主持人,职位:1207年独角兽
    2020年4月编辑
    你好@Thiru

    您不能直接查看它们,需要先使用存储操作符存储它们。这就是我在附件过程中所做的。您需要更改存储位置,因为前面的存储位置链接到我的存储库。你需要命名结果存储与宏在我早些时候的帖子通知。一旦完成并运行该过程,存储操作员将存储adaboost_1、adaboost_2、....的结果在存储库操作符中提到的

    像我一样附加商店操作员。然后将它指向一个存储库位置,然后给出Adaboost_%{execution_count}的名称,然后运行process并检入该存储库位置,您将找到结果
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施,保持社交距离

  • ThiruThiru 成员职位:One hundred.大师
    你好@varunm1

    谢谢你的回复。我只检查了你发来的文件。
    好的,我知道了。我通过新的流程在store operator中检索这些数据并查看结果。

    1.Adaboost_1性能显示:acc 89.04%。adaboost_10显示:99.13%。
    但整体模型性能只有:67.74%。

    是不是因为- adaboost_1到adaboost -10是在列车数据上执行的,而不是测试数据?67.74%来自测试数据?

    2.你送来的文件。显示计数:adaboost_1到Adaboost_20。而没有。If迭代adaboost操作符
    被提到为10。怎么得到20?

    等待您对上述问题的答复。谢谢

    登记
    thiru


  • ThiruThiru 成员职位:One hundred.大师
    谢谢。澄清。

    登记
    thiru
  • 奥瑞丽奥瑞丽 成员职位:1新手
    编辑3月9日
    @varunm1 @Thiru
    我有与Thiru最后的第二个问题相同的问题,关于“如果AdaBoost操作符的迭代次数被提到为10。我们如何得到20个模型的结果?”
    你能告诉我原因吗?
    谢谢!

    问候,
    奥瑞丽
登录注册置评。