- 博客(5)
- 收藏
- 关注
原创 林子雨大数据技术原理与应用期末考试练习题
Hadoop的两大核心是 和。HDFS默认的一个块大小是。D物联网、云计算和大数据。B SQL&Table库。正确答案:C你选对了。正确答案:D你选对了。正确答案:D你选对了。正确答案:D你选对了。正确答案:C你选对了。
2025-06-05 01:13:10
144
原创 林子雨主讲《大数据技术原理与应用》章节习题
1单选(2分)第三次信息化浪潮的标志是:A.个人电脑的普及B.互联网的普及C.虚拟现实技术的普及D.云计算、大数据、物联网技术的普及正确答案:D你选对了提问2单选(2分)就数据的量级而言,1PB数据是多少TB?A.2048B.1024C.512D.1000正确答案:B你选对了提问3单选(2分)以下关于云计算、大数据和物联网之间的关系,论述错误的是:A.云计算侧重于数据分析B.云计算、大数据和物联网三者紧密相关,相辅相成C.物联网可以借助于大数据实现海量数据的分析D.物联网可以借助于云计算实现海量数据的
2025-05-29 11:51:46
1450
原创 农业领域数据资源获取与分析——爬取新发地官网信息
目录1 开发环境2 程序功能介绍(1)实验目的(2)数据说明(3)技术说明3 程序设计的思路4 关键技术及难点5 程序的详细设计5.1 爬取数据5.2 读取数据5.3查看数据的整体情况5.4数据清洗5.5数据分析6 可视化展示7 结论......
2022-06-22 18:14:07
3410
3
原创 爬取泰山相关信息
一、实验目的¶使用 Selenium + chromedriver模拟浏览器行为获取数据,但由于爬虫采集的原始数据往往会存在许多问题,例如数据格式不正确,数据存在缺失、冗余等等。因此第一手获得的原始数据不能直接使用,需要进行数据清洗。本案例对爬取的泰山相关信息数据进行处理,使其成为符合我们要求的数据。二、实验内容1. 爬取数据:利用在页码框输入页码从而跳转到所要到达的页面 获取指定范围的页面,避免评论时间太过接近 爬取内容为用户名,评分,评论日期,评论正文,评论点赞数 泰安泰山风景区游
2022-05-26 17:11:00
334
1
原创 实验4 RDD编程初级实践
一、实验目的(1)熟悉Spark的RDD基本操作及键值对操作;(2)熟悉使用RDD编程解决实际具体问题的方法。二、实验平台操作系统:Ubuntu16.04Spark版本:2.1.0三、实验内容和要求实验内容与完成情况:1.spark-shell交互式编程(1)该系总共有多少学生;(2)该系共开设来多少门课程(3)Tom同学的总成绩平均分是多少(4)求每名同学的选修的课程门数;具体如下(5)该系DataBase课程共有多少人选修;(.
2022-05-26 16:43:22
3159
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人