《大数据与数据挖掘实验系统.pptx》由会员分享,可在线阅读,更多相关《大数据与数据挖掘实验系统.pptx(22页珍藏版)》请在课桌文档上搜索。
1、,大数据与数据挖掘实验系统,大数据的特点,大数据首先是数据量大,典型的大数据系统所管理的数据可达PB级,其次大数据的来源复杂,数据质量差异较大,最后大数据的数据关系复杂,难以用传统的关系型数据库描述,大数据分析的基石,大数据实验系统所支撑的学科与课程,大数据与数据挖掘实验类别,大数据实验系统整体框架,大数据与数据挖掘实验基础软件,数据挖掘基础语言环境R语言最为流行的开源统计与数据挖掘软件可跨平台运行,高效的脚本语言为数据分析和显示提供的强大图形功能丰富的高质量的开源第三方算法软件包大数据分析环境Hadoop开源大数据分析的事实标准大量的互联网公司作为实际生产平台方便的Java开发环境不断演进的
2、良好生态环境,大数据与数据挖掘实验基础软件,最流行的商用数据统计分析软件SAS功能强大,统计方法齐全使用简便,操作灵活简单而强大的通用数据分析软件Excel数据统计分析利用VBA进行数据挖掘分析通用开发语言Java数据爬取自然语言处理,大数据实验平台网络拓扑,服务器端R计算服务Hadoop集群虚拟化实验台,学生端远程连接开发环境测试环境,大数据实验系统实验内容(1),数据挖掘展示性实验用于展示常用数据挖掘算法的作用,使用者通过实验系统所提供数据集,直观理解数据挖掘算法的输出结果,大数据实验系统实验内容(2),数据挖掘R语言开发实验利用实验系统提供的R语言环境,学习基本的R语言开发方法,并针对提
3、供的数据集开发数据挖掘算法,大数据实验系统实验内容(3),数据挖掘SAS开发实验利用实验系统提供的SAS环境,学习基本的SAS开发方法,并针对提供的数据集开发数据挖掘算法,大数据实验系统实验内容(4),基于Hadoop的大数据基础实验利用实验所提供的环境,学习基本的MapReduce 算法,利用提供大数据在Hadoop实现大数据实战分析,大数据实验系统实验内容(5),与大数据相关的其他实验实现大数据分析中常用的Excel数据分析、数据爬取、自然语言处理、数据库使用等实验,实验平台管理方式,B/S架构的管理体系,系统分为管理员、教师与学生三种角色管理员管理实验内容以及教师用户注册,教师管理实验开放、实验流程以及学生打分学生用户完成实验内容,提交实验报告,虚实结合的实验平台,以云计算的方式提供实验开发环境以学生端虚拟化的方式提供本地Hadoop环境以后台服务方式提供R语言自动运行服务以Shell方式提供支持大数据的Hadoop运行环境,自动化实验管理平台,学生端实验环境自动启动与环境恢复服务端资源自动分配与调度实验数据集自动化准备与初始化,实验过程说明(1),数据挖掘展示性实验,实验过程说明(2),数据挖掘R语言开发实验,实验过程说明(3),大数据基础实验,实验过程说明(4),综合性实验,谢谢,