自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 林子雨大数据技术原理与应用期末考试练习题

‏Hadoop的两大核心是 和。‎HDFS默认的一个块大小是。D物联网、云计算和大数据。B SQL&Table库。正确答案:C你选对了。正确答案:D你选对了。正确答案:D你选对了。正确答案:D你选对了。正确答案:C你选对了。

2025-06-05 01:13:10 144

原创 林子雨主讲《大数据技术原理与应用》章节习题

1单选(2分)‌第三次信息化浪潮的标志是:A.个人电脑的普及B.互联网的普及C.虚拟现实技术的普及D.云计算、大数据、物联网技术的普及正确答案:D你选对了提问2单选(2分)‍就数据的量级而言,1PB数据是多少TB?A.2048B.1024C.512D.1000正确答案:B你选对了提问3单选(2分)‍以下关于云计算、大数据和物联网之间的关系,论述错误的是:A.云计算侧重于数据分析B.云计算、大数据和物联网三者紧密相关,相辅相成C.物联网可以借助于大数据实现海量数据的分析D.物联网可以借助于云计算实现海量数据的

2025-05-29 11:51:46 1450

原创 农业领域数据资源获取与分析——爬取新发地官网信息

目录1 开发环境2 程序功能介绍(1)实验目的(2)数据说明(3)技术说明3 程序设计的思路4 关键技术及难点5 程序的详细设计5.1 爬取数据5.2 读取数据5.3查看数据的整体情况5.4数据清洗5.5数据分析6 可视化展示7 结论......

2022-06-22 18:14:07 3410 3

原创 爬取泰山相关信息

一、实验目的¶使用 Selenium + chromedriver模拟浏览器行为获取数据,但由于爬虫采集的原始数据往往会存在许多问题,例如数据格式不正确,数据存在缺失、冗余等等。因此第一手获得的原始数据不能直接使用,需要进行数据清洗。本案例对爬取的泰山相关信息数据进行处理,使其成为符合我们要求的数据。二、实验内容1. 爬取数据:利用在页码框输入页码从而跳转到所要到达的页面 获取指定范围的页面,避免评论时间太过接近 爬取内容为用户名,评分,评论日期,评论正文,评论点赞数 泰安泰山风景区游

2022-05-26 17:11:00 334 1

原创 实验4 RDD编程初级实践

一、实验目的(1)熟悉Spark的RDD基本操作及键值对操作;(2)熟悉使用RDD编程解决实际具体问题的方法。二、实验平台操作系统:Ubuntu16.04Spark版本:2.1.0三、实验内容和要求实验内容与完成情况:1.spark-shell交互式编程(1)该系总共有多少学生;(2)该系共开设来多少门课程(3)Tom同学的总成绩平均分是多少(4)求每名同学的选修的课程门数;具体如下(5)该系DataBase课程共有多少人选修;(.

2022-05-26 16:43:22 3159 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除