企业大数据

首页 课程体系 企业大数据
企业大数据

企业大数据

课程内容:企业主流项目开发,真实企业环境,零基础可学,由浅入深,万行代码手把手实战项目训练,从基础到提高到专家,精细化教学。

课程特色:15天快速取证,98%的认证通过率,考不过免费重修

授课地点:暨南大学创业学院

免费试听课程

企业大数据-课程介绍

世界上的所有行业几乎都在应用Oracle技术,《财富》100强中的98家公司都采用Oracle技术。Oracle是**个跨整个产品线(数据库、业务应用软件和应用软件开发与决策支持工具)开发和部署100%基于互联网的企业软件的公司。Oracle是世界领先的信息管理软件供应商和世界第二大独立软件公司。 帮助中国软件企业在快速增长的经济大潮中取得成功,促进中国软件业的发展,同时也为中国的广大用户提供性价比高、可靠、安全的企业软件,为他们的业务增长作出贡献。由此可见:oracle的火爆程度 。

一阶段 基础课程(301课时)


课程内容

课程内容详解

Java基础课程

(189课时)

java编程语言基础(35学时)

主要讲解java环境变量搭建,jvm虚拟机运行原理性能参数调整,java基本数据类型,流程控制,数组应用等。

java面向对象编程(70学时)

主要讲解java类和对象的概念,OOP面向对象编程思想,程序设计,构造方法,以及面向对象三大特性,类与类之间的关系,接口、抽象类final,static等关键字,以及多态,异常。

各种常用API(21学时)

主要讲解String以及StringBuffer等。

java集合框架(28学时)

主要讲解整个集合框架体系内容,ArrayList,LinkedList,HashMap等。

I/O流技术(14学时)

主要讲解I/O流基本知识,流操作的基本步骤,字节流,字符流,文件操作以及文件加密,解密,文件复制,文件拆分合并等相关知识,序列化和反序列化。

java线程以及(14学时)

主要讲解介绍java线程的基本操作和相关知识;了解锁和死锁的概念以及效果,如何建立生产消费者模型。

Socket网络编程和分布式基础原理(7学时)

主要讲解介绍java基于网络的一些操作和特性,以及各种协议。

关系型数据库MySql

(42课时)

Mysql数据库(35学时)

主要讲解SQL语句相关方面的知识,数据库的操作的基本流程,以及一些常见的企业开发中涉及到的业务方面的数据设计知识以及一些数据库设计工具的使用;基本SQL操作(增,删,改,查,函数,条件查询,排序,递归查询等操作),表和表之间的关系配置,以及一些常用的企业开发数据库设计技巧,如权限管理等表结构设计,视图,分区,索引。

JDBC(7学时)

主要讲解jdbc相关的知识,jdbc基本操作,预处理命令,批处理,jdbc缓存技术,以及jdbc封装思想和数据库连接池技术的开发和应用。

Web开发课程

(35学时)

Jsp/Servlet(35学时)

主要讲解一些简单的jsp和servlet应用, 保证学生能够使用基本的增删改查。

Linux操作系统

(35课时)

Linux简介(4学时)

主要了解什么是操作系统、什么是Linux;了解Linux之前,Unix的历史;了解GNU计划;Linux的发展以及Linux的各个发行版本。

Linux环境搭建(4学时)

主要讲解Linux安装流程;理解Linux部署;理解Linux基本操作命令。

Linux常用命令(12学时)

主要讲解磁盘操作命令;权限管理命令;文件查找命令;本机帮助命令;压缩解压命令;网络相关命令;系统相关命令;vi命令。

Linux基础(3学时)

主要讲解Linux系统监测相关命令;理解crontable的使用;掌握Linux软件包的使用。

Linux网络管理(2学时)

主要讲解Linux的网络配置;掌握互联网的寻址流程和原理;掌握如何经过Window远程管理Linux服务器;掌握如何构建FTP/SSH服务应用;掌握如何实现不同系统平台之间的文件共享。

Shell脚本(6学时)

主要讲解Shell脚本结构;掌握Shell变量定义;掌握Shell基本语法;掌握Shell调试。

综合应用实操(4学时)

主要知识点串线。

第二阶段 大数据基础课程(105课时)

课程名称

课程内容

课程内容详解













Hadoop课程

(91课时)

大数据的概述(7学时)

主要讲解大数据历史;大数据出现的原因;大数据解决的问题;大数据目前的发展状态;大数据未来的;我们生活中各行业的大数据应用;云计算的概念;选择hadoop的原因;hadoop在云计算中的作用;hadoop依赖的所有技术和之前课程的联系。

hadoop集群的搭建(17.5学时)

主要讲解介绍单机版和伪分布式安装,详细介绍每个方式的区别,解决什么问题以及详细的配置,并对每个配置文件做深入讲解。能够查看hadoop进程;理解hadoop启动的整个过程。

掌握hadoop集群的搭建、HA安装(ZK);介绍并带领学生使用hadoop的命令,操作hadoop集群文件的上传、下载、删除等操作;日志错误信息、常见的错误处理方式;zookeeper的介绍与安装。

HDFS基础概念介绍(7学时)

主要讲解块的概念、块的好处、冗余备份、块的切分;元数据概念;NameNode工作原理; DataNode工作原理;Secondary NameNode;客户端含义;HDFS文件操作过程;元数据的持久化;什么是EditsLog和FSImage静像文件;EditsLog和FSImage合并--Checkpoint机制;HDFS命名空间;安全模式;心跳机制;机架感知。

HDFS API案例(7学时)

主要讲解案例包括上传本地文件到HDFS;从HDFS下载文件到本地;创建HDFS文件;创建HDFS目录;重命名HDFS文件;删除HDFS文件;删除HDFS目录;查看某个文件是否存在;数据类型,writeable接口。

YARN资源调度框架介绍(7学时)

主要讲解客户端程序与ResourceManager交互;客户端存贮封装信息;ResourceManager调用NodeManager;NodeManager划分资源池;ResourceManager调用MapReduce程序;执行运算;hadoop伪分布式安装、HA安装,加入YARN的进程,反推理论;运行MR程序,观察YARN在程序运行中的处理过程;hadoop1.0到2.0的变化(新加)。

Mapreduce介绍(7学时)

主要讲解MapReduce产生背景;MapReduce官方解释;MapReduce特点;MapReduc计算流程:inputsplit、mapper、combine、shuffle、sort、reducer;MapReduce容错性;MapReduce推测机制;MapReduce应用场合以及MR的整个流程的图解。

Mapreduce案例(28学时)

主要讲解经典的MR程序,包括(计数器、InputFormat输入格式、OutputFormat输出格式、单词计数程序Combiner优化、去重编程、平均程序、数据排序、全排序、倒排序、二次排序、单表关联、多表关联、join连接);排序算法,归并排序,底层源码分析,分区算法;讲解job提交作业的流程;经过WebUI查看log日志。




Zookeeper

14课时)

Zookeeper介绍和安装(3学时)

主要讲解Zookeeper介绍;Zookeeper下载与安装;Zookeeper配置。

Zookeeper集群搭建(4学时)

主要讲解搭建Zookeeper集群;选举机制及Leader测试;Zookeeper客户端操作。

Zookeeper API客户端开发(7学时)

主要讲解Zookeeper客户端API调用;Zookeeper类、Stat类介绍;创建和删除路径Path;ACL理解;CreateMode:创建模式、VERSION版本;设置数据、获取children、Watch(观察者)。

第三阶段 分布式数据库课程(95课时)

课程名称

课程内容

课程内容详解











HBase

(35课时)

HBase简介(2学时)

主要讲解HBase概念;掌握HBase旧版本体系结构;掌握HBase工作原理;掌握HBase的组成;掌握HBase的容错性;理解HBase应用场景。

HBase环境搭建(9学时)

主要讲解HBase安装流程理论;理解HBase安装模式理论;掌握HBase安装及验证理论;理解HBase基本应用操作;了解查看HBase表内容的几种方式。

掌握HBase版本选择的依据;理解HBase本地模式安装过程;熟练HBase单机模式安装的相应命令;掌握Eclipse HBase开发环境搭建过程。

理解HBase伪分布式安装流程;掌握HBase分布式安装过程;掌握Zookeeper安装过程;初识HBase常用Shell命令;初识HBase API的调用过程。

HBase开发入门(7学时)

主要讲解HBase Shell常用基本命令;掌握HBase Shell常用表管理命令;掌握HBase Shell常用表操作命令;掌握HBase API常用表数据操作开发过程;掌握HBase API常用表管理操作开发过程;掌握新旧版本HBase API调用的差异。

HBase基础API(6学时)

主要讲解HBase基础API的内容及特点;理解HBase基础API开发流程;掌握HBase新、旧二个版本下Put与Delete;理解原子性操作概述;理解Get方法相关理论知识;掌握常规操作:单行get、Result类、get列表(ListCell、RawCell)、错误列表、获取数据方法;掌握多版本的写法。

HBase高级API(5学时)

主要讲解Scan方法相关理论知识;掌握常规操作:指定行、ResultScanner类、按RowKey范围取、多版本;掌握新、旧二种版本的写法;理解过滤器相关理论知识;掌握常规操作:行、列、列名、值、分页过滤器。

综合应用(6学时)

主要讲解表设计相关理论知识;掌握表中列族的设计; 掌握表中RowKey设计;理解翻页原理。












Hive

(60学时)

hive入门(7学时)

主要讲解Hive产生的原因;理解HQL解析成MapReduce原理的工作流程;理解Hive体系结构;理解Hive应用场景;初步理解Hive与传统数据仓库的异同。

掌握Hive启动过程、表内容查看几种方式;掌握基本Hive命令操作知识;初步理解Java经过JDBC调用Hive的过程。

Hive环境搭建(4学时)

主要讲解Hive安装前的准备工作;理解Hive内嵌、独立、远程三种安装模式;熟练掌握Hive远程安装过程。

Hive管理(6学时)

主要讲解HiveQL数据类型及转换机制;理解Hive文本文件数据编码格式;初步了解表存储格式;熟练掌握Hive建表操作方法

熟练Java经过JDBC调用Hive过程;了解Hive的几中服务:Hive Shell、JDBC/ODBC、Thrift服务、Web接口。

HiveQL基本语法(3学时)

主要讲解存储格式;掌握创建表的语法;掌握导入数据、删除表、修改表的操作。

HiveQL查询(10学时)

主要讲解使用正则表达式来指定列;掌握列值计算、算数运算符的使用方法;掌握函数、Limit语句的使用方法;熟练列别名、嵌套Select句式;熟练CASE-When-Then句式;When语句。

熟练Group By语句用法;熟练内连接、左外连接、右外连接、半连接的用法;理解Map连接的用法。

掌握Order By、Sort By、Distribute By、Cluster By用法;掌握Union All语法。

高级应用(7学时)

主要讲解分区的原理和用法;掌握分桶的原理和用法;掌握视图的原理和用法;掌握索引的原理和用法。

Hive函数(3学时)

主要讲解Hive函数应用原因;掌握调用函数的应用过程;掌握标准函数的应用过程;掌握聚合函数的应用过程;掌握表生成函数的应用过程。

Hive自定义函数(4学时)

主要讲解编写UDF的基本语法过程;掌握编写UDAF的基本语法过程。

综合应用(16学时)

主要考核HiveQL基本应用;考核分区、分桶、视图、索引应用;考核函数,尤其是自定义函数的应用。

第四阶段 大数据高级进阶课程(207课时)

课程名称

课程内容

课程内容详解






Python

(70)学时

简介及安装(16学时)

主要讲解Python简介、Python开发环境搭建;Python数据类型和运算符;Python条件语句

基础语法(16学时)

主要讲解Python for循环、while循环;break与continue;字符串的使用、元组的定义及使用。

函数与面向对象(16学时)

主要讲解Python中列表、元组、字典;函数的定义及使用;lambda匿名函数及应用;变量的作用域;参数的传递、类的定义、对象创建;面向对象的封装、继承、多态。

模块与IO(16学时)

主要讲解模块概念;模块用法;导入模块;IO模块的使用;日历模块的使用;异常的概念及处理。

正则表达式(16学时)

主要讲解正则表达式概念及应用场景;search和match方法;正则表达式的修饰符;正则表达式的模式;正则表达式的应用。

爬虫之分布式爬虫(21学时)

主要讲解redis简介;安装测试;多机测试;scrapy_redis;简单应用测试;多机协作的redis。

爬虫之反爬虫(14学时)

主要讲解反爬虫介绍;问题的分类;顺从的艺术;反爬虫策略;爬虫编写注意事项。













Spark

(102课时)

spark基础(7学时)

主要讲解Spark 概述;Spark 生态系统;与MapReduce比较;体系结构与工作原理;安装部署及测试;spark应用场景。

RDD (21学时)

主要讲解Spark程序模型;Spark弹性数据集;RDD与共享式内存区别;Spark算子分类及功能;Spark 核心算子介绍:aggregate、aggregateByKey、cartesian。

Spark核心算子:coalesce, repartition,fullOuterJoin

、cogroup [Pair], groupWith [Pair]、combineByKey[Pair] ,count,countByKey [Pair]、countByValue,distinct,filter,filterWith  (deprecated)、flat Map,flatMapValues,flatMapWith,fold,foldByKey。

Spark核心算子:groupBy、groupByKey [Pair]、intersection、join [Pair]、keys [Pair]、values[Pair]、leftOuterJoin [Pair]、map、mapPartitions、mapPartitionsWithIndex、mapValues [Pair]、max、min、reduce、reduceByKey [Pair]、rightOuterJoin、sample、sortBy、sortByKey、sum 、take、top、zip、zipWithIndex;RDD特性、常见操作、缓存策略;RDD Dependency、Stage。

spark工作机制(7学时)

主要讲解Spark应用执行机制;Spark调度与任务分配模块;容错机制及共享变量和累加器;Lineage机制;Checkpoint机制;Shuffle机制;集成开发工具开发spark程序;web监控图讲解。

spark编程实战(7学时)

主要讲解编写wordcount程序;TopK;中位数;倒排索引;Countonce;倾斜连接等程序并经过web监控图进行查看。

spark SQL(7学时)

主要讲解Spark SQL概述;DataFrame及DataSet;SparkSession的使用;编程方式执行Spark SQL查询;sparkSQL 数据源之mysql;sparkSQL 数据源之hive;sparkSQL 数据源之json。

sparkSQL运行原理(7学时)

主要讲解Spark SQL组件、架构;DataFrame、SparkSQL运行原理;SparkSQL电商日常数据分析。

电商数据项目(14学时)

主要讲解python爬虫抓取数据;解析json数据;hive建表,数据填充;SparkSQL日常分析;数据的可视化展现。

SparkStreaming基础(7学时)

主要讲解Spark Streaming运行原理;DStream;DStream 常用函数;容错处理;与flume和kafka的集成。

SparkStreaming案例(百度统计的流式实事监控系统)(14学时)

主要讲解nginx日志文件,flume采集;kafka的应用;SparkStreaming 实时分析;结果写入Mysql数据库。

Spark MLlib(7学时)

主要讲解机器学习基本认识;分类算法、聚类算法;回归算法、决策树和随机森林;K近邻算法;贝叶斯决策论;EM算法。

综合应用(4学时)

主要对重要知识点串线。








Flume

(14学时)

实时计算介绍和Flume基础(1.5学时)

主要介绍实时计算与离线计算区别;实时技术应用;实时分析三种框架比较;实时分析技术架构。

Flume安装和相关概念(2学时)

主要讲解Flume安装,event介绍; Flume Agent内部原理; 配置Flume Agent。

source相关配置及测试 (3.5学时)

主要讲解source的生命周期;source的配置;常用的几种source的介绍以及应用;Flume拦截器。

channel相关配置及测试 (1.5学时)

主要讲解channle作用;channle事务性;channle的种类;channle配置;Channel选择器。</s

报名学习
通过高薪之路在这里

立即报名

相关 教程

12c OCM升级培训

12c OCM升级培训

11g OCM于2019年12月31日退役,12c OCM成为目前最新、最高版本的Oracle DBA认证。含金量无出其右。}

11g OCP培训

11g OCP培训

11g OCP培训}

OCJP认证培训

OCJP认证培训

OCJP认证培训}

网上报名 免费试学+报名即可领取免费资料

QQ在线客服

  • 刘老师
  • 在线咨询
  • 麦老师
  • 在线咨询
  • 黄老师
  • 在线咨询
在线免费试课
获取免费课程视频资料