登录
注册
乐鱼全站app下载
解决方案
资源
定价
乐鱼网
公司
你好,陌生人!
看起来你是新来的。登录或注册开始。
用RapidMiner登录
用RapidMiner登录
登录
注册
快速链接
类别
最近的讨论
最好的…
没有回答
组
类别
17.2 k
所有类别
19.2 k
帮助
442
知识库
RapidMiner社区
得到帮助。学习最佳实践。与同事建立联系。
讨论
如何循环通过图片进行文本识别
作者
日期内
1天
3天
1周
2周
1个月
2个月
6个月
1年
的
例如:星期一,今天,上周,三月26日,3/26/04
搜索
0评论
0的讨论
0成员
0在线
问一个问题
找到有用的视频
首页
;
帮助
如何循环通过图片进行文本识别
tngo
成员
职位:
3.
学我
2020年6月
2020年6月编辑
在
帮助
大家好!
我是Rapidminer的新手,如果您能提供任何帮助,我将不胜感激。我有一个数据库的url字段。所有的url都是图片。我需要找到一个进程,无需手动单击URL,我仍然可以从我的数据集中的每一行的URL图像提取文本。我的数据集有数十万行。
标记:
循环+分支
文本挖掘+ NLP
图像分析
0
答案
kayman
成员
职位:
662
独角兽
2020年6月
由于rapidminer没有开箱即用的“img to text”操作符,您将需要在这里使用python扩展。
一种可能的工作流程是使用RM循环所有的db记录-> webmining扩展下载图像并将其存储在本地-> python使用例如opencv读取图像-> pytesseract做OCR获取文本->返回文本到Rapidminer并继续下一个图像。
1
rdesai
员工,rmresearch人员,会员
职位:
11
RM研究
2020年6月
在深度学习扩展与我们的新功能,您可以很容易地通过使用“从图像提取文本”,因为该操作符使用Tesseract OCR库。如果你有多个图像,那么你可以通过在进程中添加另一个称为“读取图像元数据”的操作符来循环图像。
2
tngo
成员
职位:
3.
学我
2020年6月
@kayman
嗨,Kayman,谢谢你的帮助!你能详细说明一下如何下载这些图片吗?我使用操作符获取页面,我没有看到从url下载图像的任何选项
0
tngo
成员
职位:
3.
学我
2020年6月
@rdesai
,非常感谢!我试过你的方法,很有效。但是,我要么需要能够从数据库中的url自动下载所有图像到我自己的文件夹,要么需要一种替代方法来运行此操作,而不需要将图像下载到文件夹中。你有什么想法吗?
0
kayman
成员
职位:
662
独角兽
2020年6月
您可以使用[打开文件]操作符,它允许您基于url选择文件。如果你把它和[写文件]操作符结合起来,你可以把它保存在你的磁盘上。您可能需要对宏做一些调整来定义文件名和文件夹,但本质上这应该是正常的。
0
kayman
成员
职位:
662
独角兽
2020年6月
@rdesai
哦,哇,我还不知道呢
0
登录
或
注册
置评。
答案
一种可能的工作流程是使用RM循环所有的db记录-> webmining扩展下载图像并将其存储在本地-> python使用例如opencv读取图像-> pytesseract做OCR获取文本->返回文本到Rapidminer并继续下一个图像。
嗨,Kayman,谢谢你的帮助!你能详细说明一下如何下载这些图片吗?我使用操作符获取页面,我没有看到从url下载图像的任何选项