“使用循环集群?”

PrablyPrably 成员职位:3.贡献我
2019年6月编辑 帮助
嗨,RM马斯特斯!

我是RM的新手,对循环和宏没有经验。我需要关于如何构造一个循环集群的过程的建议。我试图得到三个质心-每个位置和疾病组合的低/中/高(见下文)。这样,当未来收到关于从[地点B]为[疼痛]签订的合同需要多长时间的数据时,我就可以判断它是花费了太长时间,还是在正常轨道上,还是提前了。

我非常确定我想运行集群(k-means),对属性Location和Illness的所有唯一组合进行循环。所以我想为[地点A和埃博拉]子集获取3个质心,为[地点B和感冒]、[地点C和感冒]获取3个质心,等等。属性Milestone 1、Milestone 2、Milestone Final是我想用于群集的数值属性。

我的数据集大约有13000个例子,我还有一些其他的多项式属性没有在这里列出。

请原谅格式;下面是一个有代表性的例子:


合同ID位置疾病状态合同类型开始日期里程碑1里程碑2里程碑结束
2013年1月10日78 133 154
2 A Aids未完成小2009年5月1 125 162
3冷完成大2012年8月17日40 118 214
7 B awesome Finished Small 2007年9月27日42 150 209
8 C胃部不适未完成小2009年12月20日10 101 219
9 D埃博拉结束大1/16/2009 9 111 246
10 D头痛未完成大2005年9月11日57 127 238
11 D俱乐部脚未完成小2005年12月2日55 141 204
12 D辅助完成小2/3/2012 15 106 191
13 D胃部不适完成小11/27/2009 48 103 194
14 D埃博拉结束大2005年5月18日86 101 160
15 D埃博拉结束大2009年11月15日7 148 164
16 D疼痛未完成小2005年5月25日29 117 242
18 D俱乐部脚未完成大2011年4月28日41 147 190
19 D俱乐部脚未完成小2007年4月20日48 113 229

此外,任何关于如何学习使用循环宏的想法都是非常棒的。

提前谢谢你的建议!

答案

  • jaysunice3401jaysunice3401 成员职位:6因素二世
    这可能会有所帮助。首先,使用Generate Concatenation操作符创建一个连接Location和Illness的新字段。然后,将其输入到循环值操作符中。当您处于循环的Subprocess中时,您将希望基于新的连接属性进行筛选。诀窍在于,您将希望使用%{loop_value}——即Location_Illness=%{loop_value}。然后,从那里继续。希望这能有所帮助。
    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 5.3.000 " >
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文





    < /操作符>





    /> .

    .
    .
    > < /过程
    < /操作符>

    /> . .
    .
    > < /过程
    < /操作符>
    > < /过程
登录注册置评。