旨在用于特定应用程序域或用例中的算法和操作员。
该扩展名提供了一种简单的机制,可以从文本中提取词性和指定性识别标签。
diffbot(http://www.diffbot.com/)可用于RapidMiner 6.1或更高版本,以分析网页。
Hanminer扩展提供了一种快速易于使用的工具集,以中文普通话(HAN语言)执行文本处理和采矿任务。
信息提取扩展名为信息提取目的提供了几个操作员。Tokenizers用于将文档分为较小的部分(句子,单词,...)。
将含义Cloud的文本分析集成到您的工作流程中。包括经典自然语言处理(NLP)任务的几个API包括:主题提取,诱饵,分类,深层分类和情感分析。我们提供10种语言:英语,西班牙语,法语,意大利语和葡萄牙语以及北欧语言,阿拉伯语,中文和俄语的部分报道。使用我们的自定义工具创建自定义资源并最大化文本分析中的准确性。
舞会框架和工具集已成为过程挖掘的事实上的标准。PROM是使用MXML,SA-MXML或XE作为输入格式的可插入环境。现在,连接了舞会框架和RapidMiner数据分析解决方案。因此,可以在快速分析过程中使用任何发现,一致性或扩展算法,或者可以构建专用过程挖掘分析。
RapidMiner的本体论扩展可以在语义增强的数据中发现聚类和频繁的模式。
操作员使用遗传操作员创建分层标记范围。请参阅相关论文。
文本扩展添加了统计文本分析和自然语言处理(NLP)所需的所有操作员。您可以从许多不同的数据源中加载文本,通过一系列不同的过滤技术进行转换,并最终分析您的文本数据。
Web挖掘扩展提供了对网页,RSS feed和Web服务等互联网资源的访问。它还能够处理和转换网页的内容。
WordNet扩展名为操作员使用WordNet数据库来驱动和检测相关单词(同义词,超核,hyponyms等)