什么是M5,贪婪和t检验

sriongatcsriongatc 成员职位:1新手
我只是尝试用线性回归来训练模型。我需要从feature selection中了解M5, greedy, T-test的含义。非常感谢您考虑我的请求。: ' (

答案

  • David_ADavid_A 管理员、版主、员工、RMResearcher、会员职位:295RM研究
    2021年11月编辑
    @sriongatc

    这三种策略是减少模型中需要考虑的特征(或属性或列)数量的不同策略。
    一般来说,模型的影响因素越少越好,这样就越不容易受到噪声和错误的影响。另一方面,你也不想丢失潜在的信息。所以在选择适当数量的功能之间总是要权衡的。

    M5也称为M5 Prime,选取属性子集,是对赤池信息准则改进最大的。
    学习任务执行相同名称的统计测试,以考虑某个特性是否对目标类有重大影响。
    贪婪的是一种前向选择策略,其中每轮贡献最小的属性(同样基于赤池信息标准)被取消选择。

    哪种选择策略能给你带来最好的结果并没有什么黄金法则,最好是通过独立的参数优化来决定。但是我强烈建议对回归模型使用任何类型的特征选择(特别是如果你有不止几个属性)。

    最好的
    大卫



登录注册置评。