需要帮助对记录进行分组并与其他组进行比较

Sai2k19Sai2k19 成员职位:2新手
2019年12月编辑 帮助
我有一个数据集2列PSR,TASK_TYPE。这里PSR是唯一的数字。但是有很多任务类型是可以重复的。现在我用聚合算子应用了一个组。现在我想比较任务类型中的PSR,我不希望相同的PSR在所有的任务类型中。我只需要PSR是在任务类型,而不是在所有。
例如:如果我有一个如下所述的数据集。

PSR Task_Type
123个新
123个新
123年老
123年的过程
123年的过程
456年的过程

应用后按结果分组是
PSR Task_Type
123个新
123年老
123年的过程
456年的过程

现在我需要一个逻辑,比如如果PSR出现在旧的,新的,进程标志应该显示为新记录,这只是trans。如果一个PSR只存在于进程task_type中,那么将它标记为具有相同task_type (process)的服务。

最终结果应该是:

PSR Task_Type标志
123新trans
456流程服务

最佳答案

  • kaymankayman 成员职位:662独角兽
    解决方案接受
    你可以试试双重聚合?

    PSR和TaskType上的第一个聚合->组
    第二个聚合- PSR上的>组和计数TaskType
    如果count(TaskType) > 1,则标记PSR为Trans,否则为NotTrans

    现在你使用这个集合,将它与你原来的使用PSR作为连接字段,并将NotTrans标志替换为taskType

    有点难解释,但我希望你能理解其中的逻辑:-)
    Tghadially sgenzer MartinLiebig Sai2k19

答案

  • Sai2k19Sai2k19 成员职位:2新手
    谢谢。我明白你的意思。是的,它解决了我的问题。
    kayman
登录注册置评。