
Big Data
哎一入江湖岁月催
宜静默,宜从容,宜谨严,宜俭约。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
云计算大赛准备过程之安装虚拟机及linux系统ubuntu过程
图片上传有难度,因为这是我一边装,一边截图整理成的文档,里面的图片太多啦,有愿意认真看的这里我提供了文档原版链接,自行下载哈 链接:http://pan.baidu.com/s/1eQlnl30 密码:i4ol 首先下载好,虚拟机10版本以及注册机 还要去下载好ubuntu 推荐使用15.0以上版本 然后就是安装阶段 直接双击虚拟机10 .exe文件原创 2015-09-23 22:05:34 · 647 阅读 · 0 评论 -
ElasticSearch的基本操作
#es的的文档、索引的CRUD操作 #索引初始化操作 #指定分片指定分片和和副本的数量 #shards一旦设置不能修改 PUT lagou { "settings": { "index": { "number_of_shards":5, "number_of_replicas":1 } } } GET lagou/_settings GE...原创 2018-04-27 15:50:02 · 169 阅读 · 0 评论 -
海量数据处理算法—Bloom Filter
Bloom Filter转载 2018-04-30 10:37:30 · 189 阅读 · 1 评论 -
R语言从基础入门到提高(七)LIST (列表)
第1程序: Lists,why would you need them? 100xp Congratulations! At this point in thecourse you are already familiar with: Vectors(向量) (one dimensional array(一维数组)): can hold numeric, character or原创 2016-09-03 19:08:21 · 9392 阅读 · 0 评论 -
R语言从基础入门到提高(六) frame 框架
第1程序: What's a dataframe? 100xp You may remember from the chapter aboutmatrices that all the elements that you put in a matrix should be of the sametype. Back then, your data set on Star Wars only原创 2016-09-01 16:35:41 · 3906 阅读 · 0 评论 -
R语言从基础入门到提高(五)factor 因子
第1程序 What's a factor and why would you use it? 100xp In this chapter you dive into the wonderful world of factors. The term factor refers to a statistical data type used to store categoric原创 2016-08-31 20:05:24 · 9851 阅读 · 4 评论 -
R语言从基础入门到提高(四)matrices(矩阵)
第1程序 What's a matrix(矩阵)? 100xp In R, a matrix is a collection of elements of the same data type (numeric, character, or logical) arranged into a fixed number of rows and columns. Since you原创 2016-08-30 10:44:46 · 3831 阅读 · 0 评论 -
R语言从基础入门到提高(三)Vectors(向量)
第1程序: Vector selection: the good times (2) How about analyzing your midweek results? To select multiple(多种) elements from a vector, you can add square brackets at the end of it. You can ind原创 2016-08-29 19:48:10 · 1877 阅读 · 0 评论 -
R语言从基础入门到提高(一)Intro to basics(基础介绍)
其实之前我学习R语言,很是迷茫,不知道从何下手,想找一些视频,但是网上的视频不只少的可怜,而且还收费,对于开源的R来说就显得那么的悲剧啦,然后我想还是找一些书看一下吧,也不知道买什么书,还害怕买完后,不愿意看,然后就是PDF,找了一些PDF的书,单数吸收的没这么好,感觉都跨度挺大的,没有从基础语法讲起,即使讲了,也没那么清晰。 在一次查找ggplot 函数帮助时,发现Rstudio help 里原创 2016-08-28 15:28:12 · 1460 阅读 · 0 评论 -
R语言从基础入门到提高(二)Vectors(向量)
其实学习R感觉还挺快的,可能是刚开始学习吧,前面都是一些基础,有点编程基础的可能会入门快一些 在(一)中, 我提到了DataCamp 其实官网上是提供啦,两种还一个是 try R http://tryr.codeschool.com/ 这个网站我没有探索,如果大家觉得,DataCamp 用起来没有那么随心应手,大家可以尝试一下这个网站,估计也是挺不错的 好了,我继续把我的笔记( 贴出原创 2016-08-28 15:54:46 · 3516 阅读 · 0 评论 -
R语言学习笔记(一)
通过网易云课堂进行的学习: 第四节 输入文件地址时,上下级之间使用一个反斜杠或者两个斜杠 setwd("d:/Rstudy/code") setwd("d:\\Rstudy\\code") 安装包 install.packages("ggplot2") 加载包 library(ggplot2) 创建一个对象并把它赋值给一个变量 x1 x2 也可以使用‘=’但是据说极少情原创 2016-08-27 16:21:27 · 4438 阅读 · 0 评论 -
R语言学习笔记(二)
ps:内容来源于网络,仅供学习参考,请勿用于商业用途 主要是补充部分: 附上参考学习代码(二): ################# ######验证:无论随机变量原来服从哪种分布,只要样本容量足够大, #########其均数都会服从正态分布 ###1.正态分布#### a x a x windows(1280,720);par(原创 2016-08-27 16:24:24 · 1172 阅读 · 0 评论 -
spss初试
简单历史: 1968年 斯坦福大学的三位学生创建了SPSS 1984年: 推出啦世界上第一个微机版本SPSS 2010年SPSS公司被IBM公司并购IBM SPSS SPSS的基本功能: 数据管理 统计分析 图表分析 输出管理 统计分析功能: 描述性统计 均值比较 一般性线模型 相关分析 回归分析 对数线性模型 聚类分析 生存分析 时原创 2016-08-27 16:09:13 · 1206 阅读 · 0 评论 -
PowerDesigner连接数据库附PowerDesigner15.1汉化破解版
保存为两个文件了,一份来自网络,另一份是自己做的,一边做一边截的图。 链接:http://pan.baidu.com/s/1c1Y4UmW 密码:8f2u 另外也给大家分享一下汉化破解版的powerdesigner吧,看到个别猿类找的挺辛苦的。 PowerDesigner15.1汉化破解版 链接:http://pan.baidu.com/s/1o8ndDhw 密原创 2016-06-10 13:32:22 · 1003 阅读 · 1 评论 -
云计算大赛准备之为ubuntu安装hadoop过程
同样的:和上次的博文一样,也是一边写,一边操作,一边截图整理的文档,图片部分不方便一一上传,量大务繁,如有能帮助您的,或是有需求的,这里贴出文档具体,自行下载 链接:http://pan.baidu.com/s/1eQ6RYy2 密码:hhph 主要是参考的网上的教程:可取之点就是通过自己的理解,把一些自己在理解过程中的难点要点容易迷惑的点说一下。 一、在Ubuntu下创建had翻译 2015-09-23 22:13:35 · 500 阅读 · 0 评论 -
elasticsearch查询语句
丰富的查询语句:#match查询 这个会将爬虫二字分开 大小写处理 分词 GET lagou/_search { "query":{ "match":{ "title":"爬虫" } } } #term查询 爬虫二字不处理 不解析字段 GET lagou/_search { "query":{ "term":{ "title":"原创 2018-04-27 16:55:10 · 1044 阅读 · 1 评论