自动化人工迭代/文本分析
哈罗社区
我正面临自动化问题
初始状态 :
- 例集(100文本)中常见词从给定列表(类别)
- 7类标签词类(架构、活动、烹调等)
- 关键点是检查100文本中逐类出现多字
示例类
- 食堂列表中有词像cry、spaghetti和pizza
- 首文本中有例如2点击量(curry+批萨)文本1最终结果为2类
- 下继二类“架构性”等
- 等所有类别传递后,第二文本会得到考虑。
归根结底我们有一个结果,从类别中选出词常出现在单个文本中从此我们可以推理出该类别对文本的权重
进程已经运行,但仅手动操作所以我不得不人工修改参数100x7次(Filter实例范围),这不是很好有办法我自动运行列表对立
例程(idea):
开工取类别1并检查从1-100文本中字发生频率
二叉取类别2并检查从1-100文本中字发生频率
我希望你理解我的问题 并可以帮助我并附所有相关数据
最好的问候
派崔克
0
最佳回答
-
马科巴拉达斯 管理员、雇员、快速敏捷认证分析员、成员文章数 :246独角兽yperrick网站需要添加附加运算符afte循环运算符,因为循环值输出为集合
附加程序会转换成示例集万一属性名不匹配,你需要使用运算符工具箱中强效子5
答案解析
需要数据集外观
类别--Q----Word
架构词1
架构词2
架构.n
食品Word1
食品Word2
食物.n
环形值选择类别属性循环和内部过程中可筛选示例,这些示例包含宏对每一次迭代并运行过程的类别
希望这有帮助
感谢响应
数据编译如你所言 现在能同时编译
进程概述第一部分使用解析法
结果1:集合词类ID表示词标签表示url
效果2:汇编文字ID表示词标签表示url
下一步是加入单词和运算符内部连接不幸的是,我不知道从现在开始构建进程unit不工作显示错误消息
需要我再搭建循环运算符吗?
求情
派崔克
求情
派崔克