Rapidminer新手:想应用无监督异常值检测

Saurabh_Sawant_24Saurabh_Sawant_24 成员职位:7贡献我
2019年6月编辑 产品反馈-已解决
你好,
我是rapidminer和数据科学的新手,想在1000乐鱼体育官方app万个事务数据集上应用无监督异常值检测。
希望了解执行该活动的理想数据处理步骤和算法。谢谢。
0
0票

固定和释放·最后一次更新

评论

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    有许多不同的离群值检测方法可用,您的描述对于您想要完成的任务的性质非常模糊。此外,最佳的离群值检测类型通常取决于数据中关系的性质,以及在您看来,什么才是离群值。
    首先,我下载了免费的异常检测扩展,并看看他们的操作符。一种简单的方法是HBOS方法,它是非参数的,非常简单。它完全基于范围来识别异常值。如果这不能满足你的需求,你可以考虑一些基于密度的测量方法,比如LOF。
    没有更详细的资料,很难提出更具体的建议。不过,需要提醒的是,对于10MM记录,您可能希望先获取一个样本,并尝试一些方法来了解它们是什么样的。否则,您可能需要等待很长时间才能让RapidMiner处理这么多记录,这取决于您拥有的可用硬件资源!

    布莱恩·T。
    Lindon合资企业
    乐鱼体育官方app数据科学咨询由认证的RapidMiner专家
  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区管理员,成员,大学教授,PM版主职位:2959年社区经理
    @Saurabh_Sawant_24-如果你是新手,我建议你试试Auto Model中的“Outliers”选项。超级快速和简单。



    斯科特
  • Saurabh_Sawant_24Saurabh_Sawant_24 成员职位:7贡献我
    2018年12月编辑
    @sgenzer
    尝试自动建模,并按照建议的步骤执行,但给出了“未指定关键属性”的错误。请在“结果”部分调整参数“关键属性”
    请帮助。
  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区管理员,成员,大学教授,PM版主职位:2959年社区经理
    @Saurabh_Sawant_24你能更具体地说明你是如何/从哪里看到这条消息的吗?在你拿到这个之前你要做什么?

    斯科特

  • Saurabh_Sawant_24Saurabh_Sawant_24 成员职位:7贡献我
    @sgenzer

    请看附件中的错误。


  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区管理员,成员,大学教授,PM版主职位:2959年社区经理
    2018年12月编辑
    在我看来,这是个好虫子。推送到Bug报告抄送@IngoRM和用户通过DM请求的日志文件。
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区管理员、rmresearch研究员、成员、大学教授职位:1751年RM创始人
    你好,
    你能分享更多关于你的数据的信息吗?您有多少列,它们的类型是什么?我不能重现这个错误,所以我假设现在在你的数据集中有一些特定的东西,自动模型窒息-这显然不应该是这样。
    非常感谢您的支持,
    Ingo
登录注册置评。