没有合适的资源?快使用搜索试试~ 我知道了~
AmazonTopics:在亚马逊评论数据集上练习主题模型技术

共25个文件
scala:8个
sbt:8个
ipynb:2个

需积分: 50 0 下载量 121 浏览量
2021-06-30
09:10:07
上传
评论
收藏 174KB ZIP 举报
温馨提示
这是一个正在进行的分析在线文本数据集的项目。 数据 正在分析两个不同的数据集。 亚马逊评论它可以从下载。 一些分布相似性实验可以从下载 代码 我们在这项工作中使用了和 。 大多数计算部分,如字数、散度计算,都是在 Spark 上进行的。 然后我们使用 IPython Notebook 来可视化结果,例如向量之间的距离。 IPython Notebook 文件位于notebook/ 。 在python/ ,有一些辅助脚本,例如数据解析器。 Spark 代码位于spark/ 。 spark/DistributionalSimilarity :数据源来自分布相似性实验。 每个名词的构造向量。 向量的元素是每个动词与相应名词一起出现的次数。 输出由每对向量之间的 Jensen-Shannon 散度、向量以及向量的索引与相应单词之间的映射组成。 spark/JSDivergence :
资源详情
资源评论
资源推荐
收起资源包目录







































共 25 条
- 1























格式:zip 资源大小:19.1MB









Mika.w
- 粉丝: 43
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 如何学习好单片机编程设计方案.doc
- 互联网+背景下体育人文素养对大学生创业能力的影响.docx
- 如何使用AutoCAD的工具选项板.docx
- 对互联网+专业护理资源介入安康市养老事业发展的探索.docx
- 教育信息化管理的问题及解决对策.docx
- 第二章变电站综合自动化系统的间隔层装置.doc
- 区块链技术对于深化会计电算化的前景分析.docx
- 计算机竞赛题大全.docx
- myeclipse连接数据库建立web工程简单测试访问成功例子.doc
- VxWorks嵌入式数据库管理系统设计方案.doc
- 企业网络管理和业务调度自动化设计方案.docx
- “教学中的互联网搜索”《记金华的双龙洞》教案设计思路.doc
- 基于 IMDB 情感分析数据集运用 LSTM 结合预训练词典向量模型开展电影评论情感分类研究
- 交通指挥灯PLC控制系统方案设计书.doc
- 浅析大数据时代电力企业档案的开发利用.docx
- 项目管理之需求识别和项目识别.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制

评论0