头条资讯网_今日热点_娱乐才是你关心的时事

今日热点 时事资讯
娱乐头条才是你关心的新闻
首页 > 头条资讯 > 科技

国家开放大学大数据技术概论实验MapReduce的应用

参考答案包含四个实验文件

实验一部分答案截图

形考1-4答案来源于:https://dianda.wangkebaohe.com/1369/

------------------------下方为题目演示:

实验1:Linux系统下Hadoop安装与使用(4学时)

目的:演示Linux系统下如何使用Hadoop进行一些常用操作

内容:

1.Linux虚拟机的安装

2.常用的Linux命令

3.Linux虚拟机环境下完成Hadoop伪分布式环境的搭建

4.常用的Hadoop操作

要求:理解Hadoop生态系统及其组件,熟悉Linux系统下Hadoop的安装和使用

实验2:MapReduce的应用(4学时)

目的:在Hadoop平台编写基本的MapReduce程序实现数据分析

内容:

1.从分布式文件系统中读入数据

2.执行Map任务执行中间结果

3.通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务

4.执行Reduce任务得到最终结果并写入分布式文件系统

要求:理解MapReduce的工作流程,了解MapReduce的具体应用,了解如何处理解决常见的数据处理问题

实验3:数据可视化(6学时)

目的:展示使用Python或PySpark进行数据可视化的过程

内容:

1.Python的展示和简单介绍

2.数据的读入与简介

3.数据的预处理

4.选择合适的可视化图形

5.图形解读、分析和结论

要求:理解如何通过数据可视化的技术进行探索数据的特征和模式,发现数据中潜在的价值信息

实验4:大数据的分析与挖掘(4学时)

目的:展示数据挖掘方法如何解决实际问题

内容:

1.数据的读入与理解

2.数据的预处理

3.模型的训练

4.模型的预测与评价

要求:了解大数据分析方法用来解决实际问题时的思路,了解大数据分析的处理流程和处理方法,

形考1-4答案来源于:https://dianda.wangkebaohe.com/1369/

返回搜狐,查看更多

责任编辑:

未经允许不得转载:头条资讯网_今日热点_娱乐才是你关心的时事 » 国家开放大学大数据技术概论实验MapReduce的应用

分享到:更多 ()
来源:最喜爱的小羊驼 编辑:科技

评论

留言/评论 共有条点评
昵称:
验证码:
匿名发表