归一化问题

卡洛卡洛 成员职位:12学我
你好,快速矿工社区,

我目前正在研究一个集群模型。
我根据某些决定因素对不同的国家进行分类。
然而,决定因素是由不同的因素组成的(例如:决定因素:经济一体化程度由贸易自由和跨境贸易等因素组成)。决定交通基础设施的因素仅包括:LPI指数)。
我使用归一化操作符来隔离不同的尺度级别。
然而,每个决定因素(经济一体化程度和运输基础设施)的权重应该是相等的,因为一个决定因素比另一个决定因素包含更多的指标,到目前为止,它的权重过大。
我的问题是我应该如何在RapidMiner中进行,以便平等地加权每个行列式,而不必汇总行列式的各个因素。

感谢您的支持和提示。

致以最诚挚的问候,卡洛

最佳答案

答案

  • SGolbertSGolbert RapidMiner注册分析师、会员职位:344独角兽
    @Carlo

    这个任务看起来很有趣,但我不明白你说的行列式是什么意思。你能进一步解释一下吗?

    似乎有分类和子分类,但我还是不明白这和聚类有什么联系。

    问候,
    塞巴斯蒂安。

  • 卡洛卡洛 成员职位:12学我
    @SGolbert

    抱歉,我可能表达得有点尴尬。
    总共有5个行列式,这些是准主要类别。
    决定因素由不同数量的因素(子类别)组成。
    我试图用两个决定因素来说明它:
    • 行列式或主要范畴交通基础设施由一个因素组成,即LPI指数。
    • 行列式或主要范畴需求同质性包括因素或子类购买力,市场规模和物品周转率。
    为了确保每个子类别对各自的行列式具有相同的权重,我对其进行了标准化(因为购买力是在1到1000万的规模上以1到10的市场规模给出的)。
    在第二步(这是我的问题),我现在也想平衡主要类别,因为一个行列式只由一个因素组成,另一个行列式由三个因素组成,我不知道如何进行,如果你的意见,我将非常高兴。

    我希望这次我解释得更好微笑:

  • varunm1varunm1 主持人,职位:1207年独角兽
    你好卡罗,

    不确定我是否正确理解了这一点,但如果您对每个行列式的维数(属性)有问题,为什么不应用像PCA这样的降维技术?

    谢谢
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    MartinLiebig 斯莱姆
登录注册置评。