没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
内容概要:本文档从零基础出发,详细介绍R语言的基本概念、数据类型、对象操作、数据读取与写入、流程控制、图形绘制及高级数据分析技巧。覆盖统计分析、机器学习、数据挖掘、文本挖掘及大数据分析等领域,包括决策树、支持向量机、人工神经网络、随机森林、层次聚类、Apriori算法等多种经典算法和技术的详细讲解。文档通过大量实例帮助读者理解和掌握R语言的各种应用场景。 适合人群:对数据分析感兴趣,尤其是想学习R语言及其应用的初学者和有一定编程基础的研究人员。 使用场景及目标:适用于需要进行数据预处理、探索性数据分析、模型构建和评估的专业人士。通过对R语言的学习,读者能够熟练运用各种数据处理和分析工具,解决实际问题,提高工作效率。 其他说明:文档不仅涵盖基础知识点,还深入探讨了R语言在大数据处理方面的应用,特别是在与Hadoop和Spark集成时的表现。通过具体示例,读者可以更好地理解各个技术和工具的使用方法。
资源推荐
资源详情
资源评论





























零基础学 R 语言数据分析:从机器学习、数
据挖掘、文本挖掘到大数据分析
秋缘 编著
出版社
北 京

目 录
第 1 章 R简介...................................................................................................................... 1
1.1 开始使用 R 软件.................................................................................................................1
1.2 R 对象..................................................................................................................................4
1.2.1 向量 ..........................................................................................................................4
1.2.2 数组 ..........................................................................................................................5
1.2.3 矩阵 ..........................................................................................................................7
1.2.4 数据框 ......................................................................................................................9
1.2.5 因子 ........................................................................................................................ 11
1.2.6 列表 ........................................................................................................................ 11
1.2.7 对象转换 ................................................................................................................12
第 2 章 数据的读取与写入.................................................................................................. 14
2.1 数据的读取 .......................................................................................................................14
2.2 数据的写入与数据集 ....................................................................................................... 17
2.3 RData 格式数据的写入与读取 .......................................................................................18
2.4 读取 SQL Server 数据库的数据..................................................................................... 19
第 3 章 流程控制及自定义函数 .......................................................................................... 20
3.1 条件执行 ...........................................................................................................................20
3.2 循环控制 ...........................................................................................................................22
3.3 自定义函数 .......................................................................................................................25
第 4 章 绘图功能及基本统计.............................................................................................. 27
4.1 高级绘图 ...........................................................................................................................27

零基础学 R 语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析
·VI·
4.2 低级绘图 ...........................................................................................................................30
4.3 交互式绘图 .......................................................................................................................31
4.4 图形参数 ...........................................................................................................................32
4.5 基本统计 ...........................................................................................................................34
第 5 章 相关程序包的介绍.................................................................................................. 39
5.1 机器学习 ...........................................................................................................................39
5.2 数据挖掘 ...........................................................................................................................40
5.3 社交网络分析及文本挖掘 ...............................................................................................40
5.4 大数据分析 .......................................................................................................................41
5.5 程序包的介绍 ...................................................................................................................41
第 6 章 监督式学习 ............................................................................................................ 51
6.1 决策树 ............................................................................................................................... 51
6.2 支持向量机 .......................................................................................................................61
6.3 人工神经网络 ...................................................................................................................65
6.4 组合方法 ...........................................................................................................................70
6.4.1 随机森林 ................................................................................................................70
6.4.2 推进法 ....................................................................................................................71
第 7 章 无监督式学习......................................................................................................... 72
7.1 层次聚类法 .......................................................................................................................72
7.2 K 平均聚类算法 ..............................................................................................................75
7.3 模糊 C 平均聚类算法.......................................................................................................77
7.4 聚类指标 ...........................................................................................................................83
第 8 章 进化式学习 ............................................................................................................ 86
8.1 基因算法 ...........................................................................................................................86
8.2 人工蜂群算法 ...................................................................................................................92

目 录
·VII·
第 9 章 混合式学习 ............................................................................................................ 95
9.1 使用 C50 和 ABCoptim 程序包范例 ...........................................................................95
9.2 使用基因算法来调整人工神经网络参数的范例............................................................ 97
第 10 章 关联规则............................................................................................................ 107
10.1 关联规则简介 ...............................................................................................................107
10.2 Apriori 算法 .................................................................................................................108
第 11 章 社交网络分析和文本挖掘 ................................................................................... 117
11.1 社交网络分析 ............................................................................................................... 117
11.2 文本挖掘 .......................................................................................................................122
第 12 章 图形化数据分析工具..........................................................................................125
12.1 导入数据 .......................................................................................................................126
12.1.1 处理数据集 ........................................................................................................ 130
12.1.2 设置变量 ............................................................................................................ 131
12.2 探索和测试数据 ........................................................................................................... 131
12.3 转换数据 .......................................................................................................................135
12.4 建立、评估和导出模型 ...............................................................................................137
第 13 章 大数据分析 (R+Hadoop) ..............................................................................141
13.1 Hadoop 简介.................................................................................................................141
13.2 R+Hadoop......................................................................................................................142
第 14 章 SparkR 大数据分析........................................................................................... 170
14.1 dplyr 数据处理程序包.................................................................................................172
14.2 SparkR 数据处理 ......................................................................................................... 175
14.3 SparkR 与 SQL Server.................................................................................................181
14.4 SparkR 与 Cassandra...................................................................................................184
14.5 Spark Standalone 模式 .................................................................................................186
14.6 SparkR
数据分析 ......................................................................................................... 189

零基础学 R 语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析
·VIII·
附录 A 下载和安装 R....................................................................................................... 197
附录 B 安装 RStudio Desktop..........................................................................................203
附录 C 安装 ODBC ..........................................................................................................209
附录 D 指令及用法........................................................................................................... 214
附录 E 在虚拟机上安装 R+Hadoop ................................................................................ 218
附录 F 在虚拟机上安装 SparkR ......................................................................................247
参考文献............................................................................................................................. 272
剩余23页未读,继续阅读
资源评论


普通网友
- 粉丝: 668
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 打破科技成果转化瓶颈,赋能产业园区升级.docx
- 高校成果转化新生态:构建价值网络的数智引擎.docx
- 高校科技成果转化困局与生态协同机制构建.docx
- 高校科技成果转化生态赋能新路径.docx
- 高校科技成果转化数智生态构建之道.docx
- 高校院所科技成果转化数智服务平台:构建生态价值网络.docx
- 高校院所科技成果转化数智服务平台:生态赋能创新转化.docx
- 高校院所科技成果转化数智服务平台:构建协同创新新生态.docx
- 高校院所科技成果转化数智服务平台:生态赋能型创新报告.docx
- 高校院所科技成果转化数智服务平台:生态赋能型营销软文.docx
- 高校院所科技成果转化数智服务平台赋能创新生态建设.docx
- 高校院所科技成果转化数智服务平台推动科技创新与产业发展深度融合.docx
- pytorch实现两个轻量级分割网络模型.zip
- 关于构建区域科技成果转化服务体系的建议.docx
- 构建高校院所科技成果转化新生态的数智化平台.docx
- 技术经纪人如何突破转化瓶颈.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
