属性权重——

GosiaRzeGosiaRze 成员职位:3.学我
2020年6月编辑 帮助
亲爱的RapidMiner社区!

我在这里是个新手,和数据科学一样。乐鱼体育官方app我正在做大学作业的第一个分析项目。
我试着在论坛上找到答案,并遵循了建议,但我仍然卡住了。

我正在研究的数据集有35个属性,目标一个是二项(是/否)。
在我选择最相关的属性以进一步探索和检查相关性之前,我想看看每个属性中有多少%的正值“是”。

我将感激任何对一个乞讨学生的帮助。
欢呼,Gosia

标记:

最好的答案

  • GosiaRzeGosiaRze 成员职位:3.学我
    解决方案接受
    @mschmitz-谢谢!我昨天尝试了聚合操作,但我仍然犯了一些错误。

    如果我理解正确的话:
    "Aggregate->默认聚合-> Sum ->按属性分组->(我的属性)"

    我得到的是不同列中数据的总和,例如,对于“Age”列,我得到了“Yes”和“No”的年龄值的总和,分别对应于我的目标属性。那不是我想要的。

    我将“Default Aggregation->Sum”改为“Default Aggregation-> Count (percentage)”,但是每一列的结果都是一样的——每一列都显示了目标属性中Yes和No的百分比。

    我想要得到的是:从我的目标属性有多少%的是链接到每一列?
    换句话说,每列中由目标列的Yes和No定义的示例的百分比是多少?

    我犯了什么错误?




答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
    mhh,
    是的,它有点复杂。也许附带的流程有帮助?
    最好的
    马丁

    < ?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.7.000”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文






    <过程扩展= " true " >


    < /操作符>













    仅标称
    < /操作符>
















    <过程扩展= " true " >



    <列出关键= " aggregation_attributes " >

    < / >列表


    < /操作符>

    <列出关键= " function_descriptions " >

    < / >列表

    < /操作符>







    > < /过程
    < /操作符>
















    <列出关键= " aggregation_attributes " >

    < / >列表




    < /操作符>






    > < /过程
    < /操作符>
    > < /过程




    - RapidMin乐鱼体育官方apper数据科学服务主管
    德国多特蒙德
  • GosiaRzeGosiaRze 成员职位:3.学我
    @mschmitz@Telcontar120-非常感谢,我得到了我想要的建议!最好,Gosia
  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
    @GosiaRze
    很高兴听到这个消息!值得注意的是,这很快就会转移到权重基尼指数或权重信息增益等操作中。这些通常用于评估你的属性的“决断力”。
    欢呼,
    马丁
    - RapidMin乐鱼体育官方apper数据科学服务主管
    德国多特蒙德
登录注册置评。