如何找到数据集中最重要的特征?
Christos_Karapapas
成员职位:25因素二世
在帮助
我有一个csv格式的数据集,有500多列,我已经将它导入到一个数据库中,每一列都标记为多项式,因为它们都包含不同类型的信息,现在,我想找到其中最重要的一列。
到目前为止,我已经成功地获得了一个包含特征及其权重的表,使用“X”操作符的权重,但问题是,在结果中,我在不同的行中分别获得了每个特征值。相反,我想要的是根据特征进行聚合,并为每个特征设置一个权重。我尝试使用聚合运算符,但没有运气。
举个例子,这是我得到的:
feature01-value05、重量:0,71
feature01-value13、重量:0,69
feature09-value03,体重:0,55
相反,我想要这样的东西:
feature01、重量:0 7
feature09,体重:0,55
到目前为止,我已经成功地获得了一个包含特征及其权重的表,使用“X”操作符的权重,但问题是,在结果中,我在不同的行中分别获得了每个特征值。相反,我想要的是根据特征进行聚合,并为每个特征设置一个权重。我尝试使用聚合运算符,但没有运气。
举个例子,这是我得到的:
feature01-value05、重量:0,71
feature01-value13、重量:0,69
feature09-value03,体重:0,55
相反,我想要这样的东西:
feature01、重量:0 7
feature09,体重:0,55
0
最佳答案
-
Christos_Karapapas 成员职位:25因素二世
答案
我无法得到你得到的结果…
这是我通过应用得到的结果信息增益权重的运算符高尔夫球数据集:
为了让我们重现你所观察到的并理解正在发生的事情,你能分享一下吗:
-您的XML进程或文件进程(。rmp文件)
-你的资料
问候,
莱昂内尔
很高兴你终于找到了解决办法!
问候,
莱昂内尔