外部字2vec模型使用

开曼市开曼市 成员文章数 :662独角兽
编辑2019 帮助
i可能忽略某事,但当我试图使用用colab生成的 word2vec模型时,

消息:第一行文件'/data/model/word2vec/tro

表示我们无法真正使用单词2vec模型
或有方法绕过这些错误

归根结底我也可以快速生成模型, 但它对服务器资源略不友好, 并限制共享各种应用,

最佳回答

答案解析

  • 精通器精通器 管理员、主持人、雇员、快速敏捷认证分析员、社区管理员、成员、大学教授和PM主持人文章数 :2 959社区管理员
    CC 微信
  • 马丁里比马丁里比 管理员、主持人、雇员、快速敏捷认证分析师、快速敏捷认证专家、大学教授文章数 :3 388RM数据科学家
    Hi @kayman,

    测试文件阅读2vec模型运算符

    BR系统
    马丁市
    乐鱼体育官方appRapidMiner数据科学服务主管
    德国多特蒙德
  • 开曼市开曼市 成员文章数 :662独角兽
    Hi 微信,

    读字2vec模型运算符给我报错
    反之亦然使用快速敏捷创建单词2vec模型在RM内效果良好,但如果我想用Gensim使用ython工作流时使用该模型则失败取解码错误声明负载键无效

    猜不完全兼容




  • 开曼市开曼市 成员文章数 :662独角兽
    Hi 微信,

    Gensim使用二进制文件,

    培训算法原封从C打包 https://code.google.com/p/word2vec/并扩展附加功能和优化

    估计变化就是产生互不兼容问题的原因

    反之,我会深入挖掘文档以理解 是否有方法获取更多核心格式输出
  • 马丁里比马丁里比 管理员、主持人、雇员、快速敏捷认证分析师、快速敏捷认证专家、大学教授文章数 :3 388RM数据科学家
    Hi @kayman,
    估计会触摸Word2vec容度表加敏度兼容性
    BR系统
    马丁市
    乐鱼体育官方appRapidMiner数据科学服务主管
    德国多特蒙德
  • 开曼市开曼市 成员文章数 :662独角兽
    谢谢 微信

    或多或少跳进感知代码后我发现使用替代加载并保存方法使用KeyedVectors后模型归根结底是可以互换的

    向感兴趣者加载快速miner生成模型并用感知word2vec
    myModel = gensim.models.KeyedVectors.load_word2vec_format(path_to_model_from_RapidMiner, binary=True)
    保存模型快速敏捷使用需要save2word2vecformat程序,而不是使用sim最优保存程序
    马丁里比
签名进寄存器评语