• 中国营养学会:微量营养素的隐性缺乏在我国依旧严重 2019-10-12
  • 鼓励更多社会主体投身创新创业 2019-10-12
  • 百名红色通缉令三成多归案 海外追逃难在何处? 2019-10-11
  • 扎达土林——大自然的杰作文章中国国家地理网 2019-10-11
  • D·Rita “流光溢彩”非物质文化遗产服饰秀 中式华服的全新定义 2019-09-27
  • 波司登集团获第十二届人民企业社会责任奖年度环保奖 2019-09-26
  • 给你商品加高额关税,或者某些商品不卖给你,或搭配什么条件才卖给你,这是不是标榜的市场经济、贸易自由啊? 2019-09-26
  • 中国经济稳步迈向高质量 2019-09-25
  • 新余市通报4起违反中央八项规定精神典型问题 2019-09-13
  • 互联网电视,谁来填补乐视之空? 2019-09-13
  • 忠实履行党的新闻舆论工作职责使命br不断提升传播力引导力影响力公信力 2019-09-08
  • 网友飞机偶遇出门工作的王菲,天后坐姿慵懒霸气,素颜也很美 2019-09-04
  • 买房怎么看风水这个真的实在是太重要了 ——凤凰网房产北京 2019-08-26
  • 习近平上合青岛峰会提出“五观” 贡献新时代中国智慧 2019-08-18
  • 里皮弃将发神威用脸挡出必进球 淘汰恒大他立首功 2019-08-16
  • 冰球坏小子2豆瓣:

    北京 切换校区

    全国24小时免费热线

    400-009-1906

    以下课程火热报名中

    尚学堂开班提醒

    尚学堂大数据就业捷报频传

    这,只是他们的起步薪水!

    我们2018年统计,仅是学员毕业后进入京东(135)人,阿里(41)人,百度(53)人,
    今日头条(78)人,腾讯(71)人等等

    他们的 月薪普遍超过2万,成长为技术大牛、CTO、 成功创业等的尚学堂学长,层出不穷!

    以上统计的,仅是学员毕业后首份工作的基本薪资,且不包含绩效、奖金、补助等各项福利。

    点击查看,连续8期全部就业名单 >>

    狂撒¥2019 猪年礼券200-3000元(仅限前100名)

    不负春光,和学习恋爱

    部分学员就业喜报

    前沿课程+雄厚师资+变态管理=高薪大数据人才屡创新高

    这,就是尚学堂大数据学院

    2019,欢迎您来,大牛师资带你尝尝大数据的甜头!

    肖老师

    中国电信外聘大数据专家

    企业大数据培训专家

    尚学堂大数据创始人

    尚学堂大数据学院院长

    李老师

    腾讯中国好老师

    大数据实战专家

    清华、北邮大数据及人工智能客座教授

    大型集群架构调优经验

    尚学堂大数据学院教学总监

    吴老师

    企业大数据架构专家

    企业大数据内训金牌讲师

    10年企业工作经验

    尚学堂大数据项目开发部总监

    贾老师

    阿里云/腾讯云认证金牌讲师

    曾在BAT公司任职,多年实战经验

    尚学堂大数据高级讲师
    • 肖老师

    • 李老师

    • 吴老师

    • 贾老师

    大数据174.35G视频 / 685套课后作业 / 北京1500家企业面试题
    戳我领取 >>

    师资教学怎么样?课程项目怎么样?口碑怎么样?

    免费公开课让您亲自体验下。

    大牛引路,实战贯穿!

    • 智慧交通项目
    • 电商日志分析项目
    • 游戏运营分析项目
    • App个性化推荐项目
    • 联盟广告分析项目

    阿里巴巴基于杭州智慧交通项目

    智慧交通是指在交通领域中充分运用大数据、云计算、互联网、机器学习、等技术,通过高新技术汇集交通信息,对交通管理、交通运输、公众出行等等交通领域全方面以及交通建设管理全过程进行管控支撑,使交通系统在区域、城市甚至更大的时空范围具备感知、互联、分析、预测、控制等能力,以充分保障交通安全、发挥交通基础设施效能、提升交通系统运行效率和管理水平,为通畅的公众出行和可持续的经济发展服务。

    项目??椋?/h3>

    天网搜车,智能研判,轨迹分析,套牌分析,稽查布控,跟车分析,昼伏夜出,统计分析等15大???。

    技术架构:

    hdfs +spark +kafka +flume + spark Streaming +spark MLlib+redis

    某大型电商日志分析项目

    日志分析项目是以数据为驱动,关注电商运营每一个环节,贯穿不同运营阶段,随时发现运营问题,调整运营计划。一般来说电商平台每天会产生100G到50T左右的日志数据。有了海量的数据就可以挖掘出有价值的决策依据。

    需求??椋?/h3>

    用户分析,流量分析,活动效果分析,渠道分析和订单分析等8八???/p>

    技术架构:

    nginx + HDFS+ mapreduce +Hive+hbase +spark +flume +sqoop+mysql +D3

    大型游戏运营分析项目

    大型网络游戏每天会产生10G—100G的数据,通过大数据分析可以帮助追踪注册转化率数据、快速定位注册刷号行为。通过对关卡的访问数,成功率,失败原因进行分析,来合理调整难易度。游戏生产虚拟物品,而不是印钞。您需要找到玩家在不同阶段对哪类物品有最强依赖,才能刺激痛点策划拉收。

    项目??椋?/h3>

    玩家在线分析,等级分析,任务难度分析,收入分析,虚拟消费分析等7大???。

    技术架构:

    linux+hdfs+spark+mapreduce+hive+hbase。

    App个性化推荐项目

    推荐系统是利用 大数据和数据挖掘技术向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。

    功能??椋?/h3>

    清洗数据,构建训练集,训练模型,评估模型,推荐APP等

    技术架构:

    hdfs +hive +hbase +kafka +spark +spark MLlib+ python+redis +dubbo

    联盟广告分析项目

    广告分析是指用大数据来分析和测定广告促进商品或劳务销售的效果??梢约煅楣愀婺勘晔欠裾?、广告媒体运用是否得当、广告分布时间与频率是否适宜、投入的广告费用是否合理等,从而进一步检验出广告决策是否正确、广告创意设计是否需要改进等。广告分析,能较客观地测定广告效果所取得的效益,提高广告主对广告的信心,也有利于广告公司的业务发展。

    项目??椋?/h3>

    联盟广告分析项目-项目??椋赫饪槊挥刑峁┪陌?/p>

    技术架构:

    nginx + HDFS+ mapreduce +Hive+hbase +spark +flume +sqoop+mysql +D3

    其他培训机构一直在模仿我们的项目,却讲不明白项目的思路,大数据实战项目,思路还是原装的好

    领取hadoop实战书一本 >>

    大数据课程大纲

    第一阶段

    1、学员可以自主选择 2.5个月 或者 5.5个月 的J2EE课程,学完该阶段考试合格进入大数据阶段!

    2、有基础学员可以直接参加考试,合格直接进入大数据阶段。

    3、在职学员可直接进入周末班。每月一班随到随学。

    第二阶段
    linux和高并发

    第二阶段
    linux和高并发

    第二阶段
    linux和高并发

    01 Linux基础

    操作系统概述

    Linux内核与GNU介绍

    Linux发行版介绍

    虚拟化安装centos

    虚拟网络编辑器

    规划多主机网络通信

    虚拟化管理快照与克隆

    SSH客户端使用与配置

    02 Linux初级

    Linux命令行原理

    help内部命令帮助

    man命令8种帮助手册

    df/du文件系统分析

    文件系统HFS规范

    文件系统管理命令

    bash的{}、$扩展

    03 Linux文本操作

    文件内容预览命令

    管道的使用

    基于管道的文件游标预览

    日志文件追踪

    vi命令的快捷操作

    vi命令的编辑模式

    vi命令的末行模式

    awk脚本案例:统计报表

    04 Linux文本分析

    grep检索文件

    正则表达式

    文本分析命令cut

    文本分析命令sort

    文本分析命令wc

    文本分析命令sed

    sed案例:正则和s命令另类使用

    文本分析命令awk

    05 Linux管理

    系统服务配置文件

    用户管理

    组管理

    权限管理

    案例:多用户角色资源绑定

    网络管理

    进程管理

    后台服务管理

    06 Linux安装管理

    操作系统软件安装原理

    源码编译安装及原理

    RPM包管理机制原理

    RPM的查询、安装、卸载

    YUM仓库原理

    YUM本地、局域网仓库源配置

    案例:维护多个YUM源

    YUM安装中文帮助文档

    07 Linux高级

    shell原理、命令原理

    shell解释器的4种脚本执行方式

    shell函数、内部命令、外部命令总结

    文件描述符与重定向

    输出重定向的6种方式

    输入重定向的4种方式

    案例:重定向http协议到网站请求主页

    条件表达式

    08 Linux脚本编程

    本地、局部变量

    位置、特殊变量

    父子进程、环境变量

    linux中for进程原理

    管道的子进程执行原理

    引用、命令替换扩展

    命令状态与逻辑判断

    算数表达式及bash扩展

    09 Linux脚本案例

    shell脚本:用户管理

    shell脚本:文件管理

    shell脚本:增强for循环遍历文件

    shell脚本:游标for循环遍历文件

    shell脚本:重定向while循环遍历文件

    shell脚本:管道+while循环遍历文件

    bash解释器的7中命令扩展总结

    流程控制语句&bash词的拆分扩展

    10 网络基础

    高并发及解决方案概述

    TCP/IP协议:应用层

    TCP/IP协议:传输控制层

    TCP/IP协议:TCP协议/报文/三次握手

    TCP/IP协议:网络层

    TCP/IP协议:路由表和IP协议原理

    TCP/IP协议:链路层

    TCP/IP协议:ARP协议及交换机原理

    11 四层负载均衡

    四层负载均衡LVS拓扑

    NAT网络原理

    LVS的DNAT模式分析

    LVS的DR模式分析

    LVS的TUN模式分析

    LVS的静态调度算法

    LVS的动态调度算法

    内核配置ARP协议

    LVS的命令讲解

    12 Keepalived实现高可用

    高可用概述

    健康检查及故障迁移策略

    分布式选主策略

    keepalived原理

    keepalived配置文件详解

    基于keepalived的高可用LVS

    高可用验证

    后端健康检查验证

    LVS的DR模式实验搭建

    13 Linux基础

    单点性能压力下的面向服务开发理论

    反向代理服务器原理

    Nginx介绍

    Nginx和Apache的httpd对比

    IO的阻塞模型和异步非阻塞模型

    Nginx角色框架原理

    Nginx的内核参数配置

    Nginx的内核sendfile零拷贝原理

    Nginx的TCP配置

    14 Nginx的反向代理和负载均衡

    Nginx的虚拟服务器原理

    Nginx的location匹配规则

    Nginx的自动索引

    Nginx的反向代理服务器配置

    Nginx的upstream负载均衡配置

    Nginx的DNS负载均衡配置

    Nginx负载均衡下数据一致性解决方案

    15 Session和缓存

    Session一致性问题

    Session复制

    Session共享

    Session同步

    Memcached的缓存

    K-V格式缓存

    Tomcat和Memcache

    缓存服务器

    第三阶段
    Hadoop生态体系

    第三阶段
    Hadoop生态体系

    第三阶段
    Hadoop生态体系

    第三阶段
    Hadoop生态体系

    第三阶段
    Hadoop生态体系

    第三阶段
    Hadoop生态体系

    01 Linux基础

    1T文件处理

    Hadoop历史

    Hadoop架构

    NameNode讲解

    SecondaryNameNode讲解

    DataNode与副本防治策略

    HDFS权限

    HDFS安全模式

    HDFS文件上传流程

    02 HDFS高级概念

    hadoop完全分布式集群搭建

    hadoop3新特性

    NameNode的Federation

    NameNode-HA

    NameNode-HA集群搭建

    NameNode-HA手动切换

    NameNode-HA自动切换

    java客户端操作HDFS

    HDFS读文件流程

    03 MR

    MapReduce简介与原语

    MapReduce执行流程

    二次排序

    MapReduce作业提交流程

    MapReduce作业执行流程

    YARN-ResourceManager-HA搭建

    运行自带的wordcount程序

    手写wordcount程序

    伪分布式集群搭建

    04 MR源码解析

    MapReduce作业提交流程源码解析

    作业切片计算的源码解析

    MapTask输入方式的源码解析

    MapTask执行流程源码解析

    MapTask输出方式的源码解析

    MapTask环形缓冲区源码解析

    RedueTask的shuffle源码解析

    ReduceTask分组的源码解析

    ReduceTask输出的源码解析

    05 MapReduce案例

    天气案例需求分析

    天气案例映射为MR原语

    天气案例键值对设计

    天气案例排序比较器分组比较器设计

    天气案例开发和运行

    好友推荐需求分析

    好友推荐映射为MR原语

    好友推荐键值对设计

    好友推荐开发和运行

    06 MapReduce案例

    PageRank简介及算法介绍

    PageRank映射为MR原语

    PageRank键值对设计

    PageRank编码和运行

    TFIDF简介及算法

    TFIDF映射为MR原语

    TFIDF键值对设计

    TFIDF编码和运行

    itemCF简介及算法

    07 Hive介绍及架构

    hive的介绍

    数据仓库概念讲解

    数据仓库与数据库区别

    Hive的架构原理

    Hive元数据讲解

    Hive的使用场景

    Hive的优缺点

    Hive的执行引擎

    Hive操作符

    08 Hive架构

    linux环境下mysql安装

    mysql登录权限修改

    Hive三种安装搭建模式

    Hive元数据存储到mysql

    基于内存数据库模式搭建

    基于远程数据库模式搭建

    基于远程数据库服务搭建

    Hive配置文件讲解

    Hive命令操作

    09 Hive DDL1

    Hive基础数据类型

    Hive复杂数据类型

    Hive数据类型转换

    Hive创建数据库

    Hive创建表三种方式

    Hive创建管理表

    Hive创建外部表

    Hive数据读取规则Row Format

    Hive语法解析

    10 Hive DDL2

    Hive数据读取规则 Serde

    Hive静态分区管理

    Hive动态分区管理

    Hive删除表

    Hive修改表

    Hive分桶表管理

    Hive视图

    Hive索引

    itemCF编码和运行

    11 Hive DML

    Hive从本地加载数据

    Hive从hdfs加载数据

    Hive通过查询插入数据

    Hive插入数据到指定目录

    Hive insert values插入

    Hive事务管理

    Hive事务特性

    Hive事务配置

    Hive修改数据

    12 Hive查询

    Hive全表查询

    Hive条件查询

    Hive分组查询

    Hive运算符

    Hive内置函数

    Hive自定义函数

    Hive表连接

    Hive排序方式

    Hive嵌套查询

    13 Hive访问方式

    Hive命令行方式

    Hive元数据管理

    Hiveserver2讲解

    Hive beeline客户端讲解

    Hive JDBC操作

    Hive参数

    Hive变量

    Hive脚本运行方式

    Hive GUI方式

    14 Hive安全管理

    Hive授权模式

    Hive Legacy Mode

    Hive 基于SQL标准授权模型

    Hive 基于元数据授权模型

    Hive角色管理

    Hive授权命令

    Hive回收权限命令

    Hive删除数据

    Hive清空数据

    15 Hive存储及压缩

    Hive存储压缩管理

    Hive列式存储

    Hive行式存储

    Hive textfile

    Hive sequencefile

    Hive orc file

    Hive parquet file

    Hive map端输出

    Hive reduce端输出

    16 Hbase介绍及架构

    hbase介绍

    NoSQL介绍

    Hbase特点

    Hbase存储数据结构

    Hbase数据模型

    Hbase表结构介绍

    Hbase架构图

    Hbase角色

    Hbase内存结构介绍

    Hbase存储数据结构LSM树

    17 Hbase架构及操作

    Hbase standalone模式安装

    Hbase 完全分布式安装

    Hbase 高可用

    Hbase搭建注意

    Hbase基本命令

    Hbase DDL命令

    Hbase DML命令

    Hbase命名空间命令

    Hbase写数据流程

    Hbase读数据流程

    18 Hbase Java API

    Hbase创建表

    Hbase删除表

    Hbase插入数据

    Hbase更新数据

    Hbase删除数据

    Hbase获取一条数据

    Hbase获取某个范围的数据

    Hbase过滤器

    Hbase与MR集成

    Hbase与hive集成

    19 Hbase压缩存储

    Protobuffer讲解

    Protobuffer安装

    Protobuffer配置基本类型

    Protobuffer配置集合类型

    Protobuffer生成Java类

    Hbase读取Protobuffer生成的类

    Hbase压缩存储

    20 Flume架构

    Flume日志收集工具

    Flume agent架构

    Flume组件

    Flume集群讲解

    flume不同架构介绍

    flume安装

    flume配置信息

    flume单台安装

    flume集群安装

    flume高可用讲解

    21 flume source讲解

    Avro source

    Thrift source

    Exec source

    Spooling directory source

    Kafka source

    Netcat source

    自定义Source

    Source的分类

    22 flume sink讲解

    Hdfs sink

    Hive sink

    Hbase sink

    Avro sink

    Thrift sink

    Logger sink

    Kafka sink

    自定义Sink

    23 Sqoop介绍及架构

    Sqoop简介

    ETL讲解

    Sqoop架构图

    Sqoop架构设计

    Sqoop版本介绍

    Sqoop导入

    Sqoop导出

    Sqoop安装

    24 Sqoop操作

    Sqoop导入数据到hdfs

    Sqoop导入数据到hive

    Sqoop导入数据到hbase

    Sqoop通过查询语句到hdfs

    Sqoop导出数据到mysql

    导出配置

    Hdfs配置

    Hbase配置

    25 zookeeper

    分布式协调框架

    Zookeeper背景与介绍

    分布式zookeeper环境及安装

    Zookeeper源语命令操作

    关于节点类型、版本、元数据信息的意义

    Zookeeper 的api 环境java操作集群演示

    事件注册与节点的变更

    基于zookeeper的分布式协调案例

    26 ElasticSearch

    ElasticSearch的现状与前景

    Lucene框架与倒排索引原理

    Lucene框架在el search搜索引擎中的作用

    ElasticSearch全分布式特性

    ElasticSearch的环境要求与安装

    Curl命令与rest风格的使用

    Api搜索项目演示1

    Api搜搜项目演示2

    27 CDH

    国内外大数据平台介绍

    Cloudera产品介绍

    什么是CDH

    什么是cloudera manager

    什么是cloudera manager service

    cloudera manager框架原理

    集群基础设施配置

    纯手工安装cloudera manager

    28cloudera manager使用

    cloudera manager部署CDH

    cloudera manager管理主机

    cloudera manager管理集群

    cloudera manager管理服务

    cloudera manager管理实例

    cloudera manager管理配置

    cloudera manager管理监控

    cloudera manager管理资源

    service的dashboard

    29 Hue的使用

    Hue介绍

    Hue安装

    Hue的HDFS管理与使用

    Hue的YARN管理与使用

    Hue的HIVE管理与使用

    Hue的Oozie管理与使用

    Hue的metadata管理与使用

    Hue的用户管理与使用

    30 Impala的安装

    Impala介绍

    内存计算与MR,SPARK计算的比较

    impala框架角色讲解

    impala的安装

    impala的命令行使用

    impala的命令参数详解

    impala的内部命令详解

    service图表使用

    service图表创建

    第四阶段
    Spark生态体系

    第四阶段
    Spark生态体系

    第四阶段
    Spark生态体系

    第四阶段
    Spark生态体系

    第四阶段
    Spark生态体系

    01 Scala基础语言应用

    Scala背景介绍

    Scala语言六大特性

    Scala下载安装配置

    Scala IDE开发Scala配置

    IDEA 开发Scala配置

    Scala类型推断机制

    Scala数据类型

    Scala基本语法

    Scala类和对象

    Scala 循环、判断

    02 Scala函数编程

    Scala函数定义

    Scala递归函数

    Scala默认值函数

    Scala可变参数函数

    Scala匿名函数

    Scala嵌套函数

    Scala偏应用函数

    Scala高阶函数

    Scala柯里化函数

    ScalaActor通信模型

    03 Scala字符串、集合

    Scala String操作

    Scala Array 操作

    Scala可变数组操作

    Scala List 操作

    Scala 可变列表操作

    Scala Set 操作

    Scala 可变Set操作

    Scala map 操作

    Scala 可变map操作

    Scala 元组操作及要点

    04 Scala高级应用

    Scala伴生类

    Scala伴生对象

    Scala样例类

    Scala样例类案例

    Scala Trait要点

    Scala Trait 案例

    Scala match匹配

    Scala隐式值操作

    Scala隐式参数操作

    Scala隐式函数操作

    Scala隐式类操作

    05 Spark基础使用

    Spark技术介绍

    Spark技术站详解

    Spark演变历史

    Spark与MR的区别

    Spark 基于eclipse配置

    Spark基于IDEA配置

    Spark运行模式介绍

    Spark集群搭建

    Spark配置选项详解

    Spark Pi 任务提交运行

    Spark客户端搭建

    06 Spark核心RDD

    Spark编程核心RDD

    SparkRDD原理及使用

    RDD结构及注意点

    RDD五大特性

    RDD弹性原理

    RDD分布式原理

    RDD容错原理

    coalesce算子使用

    zip,zipWithIndex使用

    07 Spark 转换算子

    map算子使用

    flatMap算子使用

    filter算子使用

    sample算子使用

    reduceByKey算子使用

    SortByKey算子使用

    Join、union算子使用

    Cogroup算子使用

    distinct,使用

    repartition算子使用

    08 Spark行动算子

    Foreach算子使用

    Take算子使用

    SaveAsTextFile使用

    Count算子使用

    Take算子使用

    Collect算子使用

    First算子使用

    CountByKey使用

    CountByValue使用

    Reduce使用

    09 Spark 持久化算子

    持久化数据级别分类

    持久化算子cache使用

    Cache要点注意事项

    持久化算子persist使用

    Persist要点注意事项

    持久化算子Checkpoint

    Checkpoint执行流程

    Checkpoint注意事项

    Checkpoint使用优化

    Spark任务提交参数详解

    10Spark任务提交方式及参数

    Standalone-client模式原理

    Standalone-client模式流程详解

    Standalone-cluster模式原理

    Standalone-cluster模式流程详解

    Yarn-client模式原理

    Yarn-client模式流程详解

    Yarn-cluster模式原理

    Yarn-cluster模式流程详解

    Client模式提交命令和特点

    Cluster模式提交命令和特点

    11 Spark术语

    Spark-ClusterManager

    Spark-Driver

    Spark-Master

    Spark-Worker

    Spark-Executor

    Spark-线程池

    Spark-Application

    Spark-job

    Spark-Stage

    12 Spark计算模式

    SparkRDD窄依赖

    SparkRDD宽依赖

    SparkStage切割划分

    SparkStage计算模式

    Pipeline管道数据落地

    Stage并行度划分

    提高Stage并行度方式

    Spark-task

    13 Spark任务调度

    任务调度角色划分

    资源调度角色划分

    Spark资源调度过程

    Spark任务调度过程

    SparkDAG有向无环图

    粗粒度资源申请特点

    细粒度资源申请特点

    Spark推测执行机制

    14 Spark任务提交案例

    Spark pv,uv案例

    Spark WordCount案例

    Spark二次排序案例

    Spark分组取topN案例

    Spark分组取topN优化

    Spark处理数据思路转换

    MasterHA高可用配置

    MasterHA搭建注意点

    15 Spark 高阶应用

    广播变量及注意事项

    累加器及注意事项

    自定义累加器

    版本对比变化

    Spark-WebUI详解

    Spark日志查看

    Pipeline计算模式验证

    历史日志服务器配置

    MasterHA高可用原理

    16 Spark 核心之Shuffle

    SparkShuffle概念

    Spark-HashShuffle普通机制

    Spark-HashShuffle优化机制

    Spark-SortShuffle普通机制

    Spark-SortShufflebypass机制

    HashShuffle执行流程详解

    SortShuffle执行流程详解

    HashShuffle与SortShuffle对比

    Shuffle文件寻址详解

    Spark oom问题处理

    Spark统一内存管理划分

    17 SparkSQL初级

    Shark原理分析

    SparkSQL原理分析

    SparkSQL演变过程

    DataFrame与DataSet

    SparkSQL数据源

    SparkSQL底层架构

    SparkSQL谓词下推

    Json格式数据转DataSet

    普通RDD和DataSet互操作

    Parquet数据转DataSet

    Spark静态内存管理划分

    18 SparkSQL高级

    SparkSQL序列化问题

    Hive On Spark原理

    Spark On Hive原理

    Spark On Hive配置详解

    SparkSQL DataSet存储

    SparkSQL之UDF

    SparkSQL之UDAF

    SparkSQL之over函数

    JDBC数据转DataSet

    aS

    KafkaTopic更改、删除

    19 SparkStreaming流式处理框架

    SparkStreaming介绍

    SparkStreaming&Strom

    SparkStreaming接受数据原理

    SparkStreaming之Dstream

    SparkStreaming读取Socket数据

    foreachRDD算子使用

    transform算子使用

    updateStateByKey算子使用

    window窗口操作

    reduceByKeyAndWindow使用

    DriverHA原理及搭建

    20 Kafka分布式消息系统应用

    Kafka分布式消息系统介绍

    Kafka应用场景

    Kafka生产消息原理

    Kafka存储消息原理

    Kafka Topic、partition原理

    Consumer消费消息原理

    Kafka集群搭建

    Kafka命令使用

    Kafka消息系统特点

    KafkaLeader均衡机制

    Kafka版本更改对比

    21 SparkStreaming+kafka整合

    Receiver模式整合原理

    Receiver模式问题及优化

    Direct模式整合原理

    Direct模式Api使用

    WAL机制配置及使用

    Receiver模式并行度设置

    Direct模式并行度设置

    无主架构模型

    21 kafka整合

    Direct模式offset管理

    新版本Direct模式使用

    新版本Direct模式对比

    新版本Direct模式offset管理

    SparkStreaming配置参数详解

    SparkStreaming反压机制

    Rdb 与aof类型

    主从架构模型

    22 Redis语法

    Redis介绍

    String1类型

    String2类型

    List1类型

    List2类型

    Set类型

    Sorted set类型

    Redis集群搭建

    23 Storm流式计算

    Storm应用场景

    Storm架构模型

    Storm框架介绍

    Storm单词统计练习

    Storm分组策略

    Storm分组实践

    Storm伪分布式安装

    24 Storm计算详解

    Storm异步与同步实时分析框架和实例

    Storm全分布式

    drpc实现

    kafka 与storm

    flume+kafka+storm

    Storm容错

    Storm事务

    Storm电信项目

    第五阶段
    机器学习和算法

    第五阶段
    机器学习和算法

    第五阶段
    机器学习和算法

    01 Python介绍及安装

    Python介绍

    Python历史

    Python优缺点

    Python应用场景

    Python下载

    Python安装

    Python ide安装

    Python helloworld

    Python交互式窗口

    Python注释及乱码

    02 Python基础知识

    Python变量

    Python类型

    Python标识符

    Python关键字

    Python输入

    Python输出

    Python运算符

    Python分支结构

    Python input陷阱

    Python 循环结构

    03 Python集合类型

    字符串

    列表

    元组

    字典

    可变类型

    不可变类型

    集合的迭代

    集合排序

    集合嵌套

    04 Python函数

    Python函数介绍

    函数的定义与调用

    Python参数

    Python返回值

    Python递归函数

    Python匿名函数

    高阶函数

    高阶函数和递归计算

    斐波拉契数列

    05 Python文件操作

    Python文件的打开与关闭

    Python的读写

    Python的定位读写

    Python文件操作

    Os???/p>

    文件批量处理

    Mp3音乐播放

    文件批量处理

    06 Python类与对象

    面向对象编程介绍

    类与对象

    定义类与创建对象

    Self

    ?;ざ韵蟮氖粜?/p>

    继承

    多继承

    多态

    类属性与实例属性

    类方法与静态方法

    07设计模式与异常

    单例模式

    工厂模式

    异常简介

    异常捕获

    异常的传递

    自定义异常

    异常处理中排除异常

    异常的分类

    08 Python??榧笆菘獠僮?/h2>

    ??榈氖褂糜氚沧?/p>

    ??橹谱?/p>

    Python中的???/p>

    ??榈姆⒉?/p>

    ??榘沧凹笆褂?/p>

    Python连接mysql

    Python查询数据库

    数据API

    API的封装

    09 Numpy库

    numpy介绍

    numpy特点

    numpy安装

    numpy基础

    矩阵的创建

    矩阵的属性

    矩阵的基本运算

    矩阵的常用函数

    矩阵的切片

    矩阵的索引

    10 机器学习基础

    PySpark基础配置

    Python开发工具配置

    PySpark运行开发原理

    Python??榘沧胺绞?/p>

    机器学习数学基础

    线性回归原理

    梯度下降迭代确定模型

    多元线性回归原理

    参数优化

    模型过拟合问题

    11 机器学习算法一

    贝叶斯分类算法

    贝叶斯概率分类原理

    贝叶斯公式推广

    拉普拉斯估计原理

    模型保存

    KNN算法原理

    KNN问题

    机器学习中的归一化

    距离度量方式

    Kmeans聚类算法原理

    12 机器学习算法二

    Kmens++算法

    K值的选择策略

    TF-IDF原理

    逻辑回顾分类算法原理

    傅里叶变化

    最大似然估计思想

    逻辑回归构造损失函数

    逻辑回顾损失函数公式推导

    逻辑回归归一化

    混淆矩阵

    13 机器学习算法三

    推荐系统原理

    推荐系统架构

    lambda架构处理数据

    实时和离线场景应用

    ML下python在Hive中应用

    dubbo使用zookeeper协调应用

    dubbo服务提供端原理

    dubbo服务消费端原理

    dubbo在推荐系统中应用

    实时在线推荐app

    14 机器学习案例

    垃圾邮件分类案例

    数据点基于贝叶斯分类案例

    手动实现KNN算法

    数据点基于KNN算法分类

    数据点Kmeans聚类案例

    14 机器学习案例

    基于Python的KMeans可视化

    微博聚类案例

    音乐分类案例

    道路拥堵预测案例

    推荐系统

    第六阶段
    平台架构师课程体系

    第六阶段
    平台架构师课程体系

    第六阶段
    平台架构师课程体系

    01 Hive优化

    hive优化思想

    hive查询计划

    hive本地模式

    hive并行计算

    hive严格模式

    hive排序

    hive map join

    hive大表join

    02 Hive优化

    hive合并小文件

    hive map与reduce个数

    hive-jvm重用

    Hive数据倾斜

    Hive脚本编程

    Hive脚本执行架构

    Hive的任务的监控

    hive map-side聚合

    03 hbase优化

    预分区

    Rowkey设计

    列族个数

    Compact合并优化

    Split优化

    多htable并发写

    Htable参数设置

    批量写

    04 hbase优化

    多htable并发读

    批量读

    多线程并发读

    缓存查询结果

    Blockcache

    Htablepool

    Hbase索引

    多线程并发写

    05 Spark核心源码分析

    Spark-pipeline iter 源码分析

    map源码分析

    flatMap源码分析

    reduceByKey源码分析

    combineByKey源码分析

    aggregateByKey源码分析

    sortByKey源码分析

    repartition源码分析

    06 Spark核心源码分析

    Spark-Master启动源码分析

    Spark-Worker启动源码分析

    Spark-Driver启动源码分析

    Spark-Application注册源码分析

    Spark-Executor启动源码分析

    Spark-资源调度源码分析

    Spark-任务调度源码分析

    Spark-Shuffle-Write源码分析

    Spark-Shuffle-Read源码分析

    Spark数据倾斜不同解决方案

    07 Spark优化

    Spark分配更多的资源

    Spark并行度调优

    Spark 代码调优

    Spark 算子选择使用

    Spark 自定义分区器

    Spark数据结构优化

    Spark数据本地化调优

    Spark内存调优

    Spark对外内存调优

    SparkShuffle调优

    08 机器学习优化

    有无截距

    线性不可分问题

    调整分类域值

    鲁棒性调优

    归一化数据

    均值归一化

    逻辑回归训练方法选择

    机器学习中python脚本优化

    09 Kylin介绍及架构

    kylin的背景介绍

    kylin的应用场景

    kylin的发展历史

    kylin的工作原理

    kylin的体系架构

    kylin的核心,cube构建

    kylin的sql查询原理

    kylin的特性和生态圈

    kylin事实表

    kylin维度表

    10 kylin的安装与部署

    kylin的下载

    kylin的安装准备

    kylin的部署方式

    kylin安装部署

    KyLin和Hive

    KyLin和hbase

    KyLin和Zookeeper

    OLAP分类

    星型模型

    雪花模型

    11 kylin的使用及访问方式

    simple cube描述

    cube构建

    kylin的视图

    kylin的元数据存储

    kylin JDBC访问方式

    kylin rest方式

    12 Flink流式处理框架一

    Flink架构原理

    Flink与Storm的区别

    Flink与SparkStreaming的区别

    Flink编程模型抽象层次

    Flink无界数据流

    Flink有界数据流

    Flink程序和数据流

    13 Flink流式处理框架二

    窗口和时间

    有状态算子操作

    容错检查点原理

    Flink任务和算子链

    Flink-TaskManager

    Flink-JobManager

    14 Flink流式处理框架三

    Flink-DataStream Api操作

    Flink与Kafka整合

    基于本地模型部署Flink

    基于Yarn模式部署Flink

    TableApi 及SQL查询使用

    网页排名案例实现

    15 Flink流式处理框架四

    数据类型和序列化

    Flink高可用

    Flink状态和容错

    Flink保存点

    Flink下载安装使用

    任务槽和资源

    尚学堂大数据变态管理模式

    完备的教学体系,为学员提供个性化辅导方案+数字化教学资源

    管理体系

    从心出发,助你学习、求职、晋升一路顺畅!

    学习氛围浓厚
    每日晚自习
    360度生活照顾
    定期末位辅导
    就业指导服务
    教学反馈系统
    教学保障系统
    学习测试系统
    学习任务手册
    在线作业系统
    综合能力评定
    我要高薪 >>

    领取机器学习数据(100课时) 平台架构师(140课时)
    大数据174.35G视频

    • 北京校区
    • 山西校区
    • 郑州校区
    • 武汉校区
    • 四川校区
    • 长沙校区
    • 深圳校区
    • 上海校区
    • 广州校区
    • 保定招生办

    北京京南校区:北京亦庄经济开发区科创十四街6号院1号楼 赛蒂国际工业园
    北京海淀区校区:北京市海淀区西三旗街道建材城西路中腾建华商务大厦东侧二层尚学堂
    咨询电话:400-009-1906 / 010-56233821
    面授课程:?JavaEE+微服务+大数据? ???大数据+机器学习+平台架构?????Python+数据分析+机器学习??人工智能+模式识别+强化学习???WEB前端+移动端+服务端渲染

     

    山西学区地址:山西省晋中市榆次区大学城大学生活广场万科商业A1座702

    郑州学区地址:河南电子商务产业园6号楼4层407
    咨询电话:0371-55177956

    武汉学区地址:武汉市东湖高新区光谷金融港B22栋11楼
    咨询电话:027-87989193

    四川学区地址:成都市高新区锦晖西一街99号布鲁明顿大厦2栋1003室
    咨询电话:028-65176856 / 13880900114

    网址://www.cssxt.com/
    咨询电话:0731-83072091

    深圳校区地址:深圳市宝安区航城街道航城大道航城创新创业园A4栋210(固戍地铁站C出口)
    咨询电话:0755-23061965 / 18898413781

    上海尚学堂校区地址:上海市浦东新区城丰路650号
    咨询电话:021-67690939

    广州校区地址:广州市天河区元岗横路31号慧通产业广场B区B1栋6楼尚学堂(地铁3号线或6号线到“天河客运站”D出口,右拐直走约800米)
    咨询电话:020-2989 6995

    保定招生办公室

    地址:河北省保定市竞秀区朝阳南大街777号鸿悦国际1101室

    电话:15132423123

    Copyright 2006-2019 北京尚学堂科技有限公司  京ICP备13018289号-19  京公网安备11010802015183  
    媒体联系:18610174079 闫老师  

    Java基础班,免费试学三周

  • 中国营养学会:微量营养素的隐性缺乏在我国依旧严重 2019-10-12
  • 鼓励更多社会主体投身创新创业 2019-10-12
  • 百名红色通缉令三成多归案 海外追逃难在何处? 2019-10-11
  • 扎达土林——大自然的杰作文章中国国家地理网 2019-10-11
  • D·Rita “流光溢彩”非物质文化遗产服饰秀 中式华服的全新定义 2019-09-27
  • 波司登集团获第十二届人民企业社会责任奖年度环保奖 2019-09-26
  • 给你商品加高额关税,或者某些商品不卖给你,或搭配什么条件才卖给你,这是不是标榜的市场经济、贸易自由啊? 2019-09-26
  • 中国经济稳步迈向高质量 2019-09-25
  • 新余市通报4起违反中央八项规定精神典型问题 2019-09-13
  • 互联网电视,谁来填补乐视之空? 2019-09-13
  • 忠实履行党的新闻舆论工作职责使命br不断提升传播力引导力影响力公信力 2019-09-08
  • 网友飞机偶遇出门工作的王菲,天后坐姿慵懒霸气,素颜也很美 2019-09-04
  • 买房怎么看风水这个真的实在是太重要了 ——凤凰网房产北京 2019-08-26
  • 习近平上合青岛峰会提出“五观” 贡献新时代中国智慧 2019-08-18
  • 里皮弃将发神威用脸挡出必进球 淘汰恒大他立首功 2019-08-16
  • 重庆时时开彩结果官网 北京pk赛车手机版 pk10计划高手群849876 快乐时时和澳洲一样的吗 江西时时首页 飞艇计划软件下载免费 网上打三公有什么技巧 ag不同平台有时间差吗 LG游戏平台 时时彩玩法 幸运飞艇计划app哪个好 一分快3大小单双技巧规律 金彩 欢乐彩票网是合法的吗 上海时时开奖結果 经典单机麻将二人麻将