连续与分类混合的特征

阴 成员职位:14贡献我
7月10日编辑 帮助
在rapidminer中,我可以使用什么功能对混合连续和混合特征的数据集执行PCA ?我将PCA应用于已经标准化的连续特征,并且只留下哑编码的分类变量,而不使用PCA。是否有降维方法(如famd)可以用在这样的数据集上吗?提前感谢。

最佳答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    解决方案接受
    你好,
    PCA本身没有定义在非数值类型上。任何其他解决方案都不是PCA。

    最好的
    马丁
    - RapidMin乐鱼体育官方apper数据科学服务主管
    德国多特蒙德

答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    你好,
    PCA根本不是根据标称值定义的。您需要首先将其转换为数字(即使用Target编码)。

    最好的
    马丁
    - RapidMin乐鱼体育官方apper数据科学服务主管
    德国多特蒙德
  • 阴 成员职位:14贡献我
    嗨,我的数据被转换了,但我问的是快速矿工的PCA是否可以处理分类变量。一般来说,在单热编码变量或分类虚拟编码变量上使用PCA是不好的。应该有一个特定的功能实现,处理混合数据,我问这是否已经集成在这里。
  • 阴 成员职位:14贡献我
    同意了。我应该说降维。我会解决这个Q,重新开始一个。
登录注册置评。