看起来你是新来的。登录或注册即可开始。
<?xml version="1.0" encoding="UTF-8"?> < parameter key="logverbosity" value="init"/> <参数key="vector_creation" value="TF-IDF"/> <参数key="add_meta_information" value="true"/> <参数key="keep_text" value="false"/> <参数key="prune_method" value="none"/> <参数key=" prune_aboow_percent " value="3.0"/> <参数key=" prune_aboow_percent " value="30.0"/> <参数key="prune_above_rank" value="0.05"/> <参数key="prune_above_rank" value="0.95"/> <参数key="数据管理" value="double_sparse_array"/> <参数key="数据管理"value="auto"/> <参数key="language" value="English"/> <参数key="max_token_length" value="3"/> <参数key="min_chars" value="4"/> <参数key="max_chars" value="25"/>
答案
>导入数据(PDF文件)使用“读取文档”(你可以使用“循环文件”并在其中插入“读取文档”操作符来读取所有PDF文件)
然后,您可以使用“处理文档”来处理您的文本,最后,您可以使用“wordlist to data”并运行“穰”港口连接。打开结果视图,选择左边的可视化,然后选择Word Cloud。至少我认为它现在有帮助,但你可以根据你的喜欢/需要改进这个过程
请看看文本挖掘教程,并确保您安装了文本挖掘扩展。
https://academy.www.kenlockard.com/learn/course/text-and-web-mining-with-rapidminer/text-and-web-mining/lets-get-started?page=1
这个例子可能会对你有所帮助。