通过替换- REGEX重命名

迈克迈克 成员职位:21因素二世
嗨,大家-努力利用regex重命名列后透视。理想情况下,尝试删除“count(IDT)_”并将年份保留在标题上。任何帮助都会很感激。附带XML和示例数据。

< ?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.0.002”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
<列出关键= "注释" / >
<列出关键= " data_set_meta_data_information " >
< / >列表
UIO
< /操作符>
<列出关键= " filters_list " >
< / >列表
< /操作符>
< /操作符>
<列出关键= " aggregation_attributes " >
< / >列表
< /操作符>
< /操作符>
<列出关键= " key_attributes " >
< / >列表
< /操作符>
< /操作符>
> < /过程
< /操作符>
> < /过程

标记:

最佳答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:888独角兽
    解决方案接受
    嗨!

    在本例中,您需要在两个地方使用regexp。
    属性过滤类型:regular_expression
    正则表达式:count\(IDT\)_。+(+是必须的,因为在这个上下文中,RapidMiner想要匹配整个字符串)
    替换什么:count\(IDT\)_(这里没有。+是可以的,因为我们实际上只是匹配字符串的这一部分)

    问候,
    Balazs
    迈克

答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:888独角兽
    嗨!

    中的括号数(IDT) _在正则表达式中有特殊的含义。这是正确的:数\ (IDT \) _

    问候,
    Balazs
  • 迈克迈克 成员职位:21因素二世
    @BalazsBarany谢谢你!我理解转义字符来识别括号,但仍然有2个问题
    1 -不识别属性
    2 - regex仍然不能识别count\(IDT\)_模式来替换为空。
    其他的想法会很有帮助的
  • 迈克迈克 成员职位:21因素二世
    @BalazsBarany-太棒了,谢谢!这工作。在这种情况下,加号是否只是处理属性名称中处理“year”的方式?谢谢你的帮助!
  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:888独角兽
    嗨!

    是的,RapidMiner需要匹配属性选择的完整字符串,而不仅仅是字符串的一部分。的.+after count\(IDT\)_匹配变量部分,在您的例子中是年份。

    问候,
    Balazs
登录注册置评。