Spark Streaming实时流处理项目实战

〖课程介绍〗:

本课程从实时数据产生和流向的各个环节出发,通过集成主流的分布式日志收集框架Flume、分布式消息队列Kafka、分布式列式数据库HBase、及当前非常火爆的Spark Streaming打造实时流处理项目实战,让你掌握实时处理的整套处理流程,达到大数据中级研发工程师的水平!

〖课程目录〗:

  • 第1章 课程介绍 试看5 节 | 42分钟
  • 课程介绍
  • 收起列表
    • 视频:1-1 -导学- (11:14)试看
    • 视频:1-2 -授课习惯和学习建议 (08:52)
    • 视频:1-3 -OOTB环境使用演示 (08:37)
    • 视频:1-4 -Linux环境及软件版本介绍 (08:21)
    • 视频:1-5 -Spark版本升级 (03:54)
  • 第2章 初识实时流处理8 节 | 35分钟
  • 本章节将从一个业务场景分析出发引出实时流处理的产生背景,对比离线处理和实时处理的区别,了解常用的实时流处理框架有哪些,实时流处理在企业级应用中各个环节的架构以及技术选型
  • 收起列表
    • 视频:2-1 -课程目录 (01:39)
    • 视频:2-2 -业务现状分析 (07:25)
    • 视频:2-3 -实时流处理产生背景 (03:14)
    • 视频:2-4 -实时流处理概述 (02:46)
    • 视频:2-5 -离线计算和实时计算对比 (03:12)
    • 视频:2-6 -实时流处理框架对比 (06:20)
    • 视频:2-7 -实时流处理架构及技术选型 (05:20)
    • 视频:2-8 -实时流处理在企业中的应用 (04:34)
  • 第3章 分布式日志收集框架Flume8 节 | 78分钟
  • 本章节将从通过一个业务场景出发引出Flume的产生背景,将讲解Flume的架构及核心组件,Flume环境部署以及Flume Agent开发实战让大家学会如何使用Flume来进行日志的采集
  • 收起列表
    • 视频:3-1 -课程目录 (01:51)
    • 视频:3-2 -业务现状分析 (08:41)
    • 视频:3-3 -Flume概述 (14:00)
    • 视频:3-4 -Flume架构及核心组件 (07:53)
    • 视频:3-5 -Flume&JDK环境部署 (10:09)
    • 视频:3-6 -Flume实战案例一 (13:35)
    • 视频:3-7 -Flume实战案例二 (06:30)
    • 视频:3-8 -Flume实战案例三(重点掌握) (14:44)
  • 第4章 分布式发布订阅消息系统Kafka11 节 | 102分钟
  • 本章节将讲解Kafka的架构以及核心概念,Kafka环境的部署及脚本的使用,Kafka API编程,并通过Kafka容错性测试让大家体会到Kakfa的高可用性,并将Flume和Kafka整合起来开发一个功能
  • 收起列表
    • 视频:4-1 -课程目录 (01:37)
    • 视频:4-2 -Kafka概述 (10:58)
    • 视频:4-3 -Kafka架构及核心概念 (04:01)
    • 视频:4-4 -Kafka单节点单Broker部署之Zookeeper安装 (04:13)
    • 视频:4-5 -Kafka单节点单broker的部署及使用 (16:46)
    • 视频:4-6 -Kafka单节点多broker部署及使用 (09:31)
    • 视频:4-7 -Kafka容错性测试 (04:25)
    • 视频:4-8 -使用IDEA+Maven构建开发环境 (06:00)
    • 视频:4-9 -Kafka Producer Java API编程 (14:11)
    • 视频:4-10 -Kafka Consumer Java API编程 (13:00)
    • 视频:4-11 -Kafka实战之整合Flume和Kafka完成实时数据采集 (16:35)
  • 第5章 实战环境搭建7 节 | 46分钟
  • 工欲善其事必先利其器,本章将讲解Hadoop、ZooKeeper、HBase、Spark的安装,以及如何使用IDEA整合Maven/Spark/HBase/Hadoop来搭建我们的开发环境
  • 收起列表
    • 视频:5-1 -课程目录 (01:11)
    • 视频:5-2 -Scala安装 (03:36)
    • 视频:5-3 -Maven安装 (05:15)
    • 视频:5-4 -Hadoop环境搭建 (10:55)
    • 视频:5-5 -HBase安装 (09:20)
    • 视频:5-6 -Spark环境搭建 (06:56)
    • 视频:5-7 -开发环境搭建 (08:00)
  • 第6章 Spark Streaming入门 试看8 节 | 43分钟
  • 本章节将讲解Spark Streaming是什么,了解Spark Streaming的应用场景及发展史,并从词频统计案例入手带大家了解Spark Streaming的工作原理
  • 收起列表
    • 视频:6-1 -课程目录 (01:19)
    • 视频:6-2 -Spark Streaming概述 (10:38)
    • 视频:6-3 -Spark Streaming应用场景 (02:16)
    • 视频:6-4 -Spark Streaming集成Spark生态系统的使用 (02:37)
    • 视频:6-5 -Spark Streaming发展史 (02:05)
    • 视频:6-6 -从词频统计功能着手入门Spark Streaming (12:10)
    • 视频:6-7 -Spark Streaming工作原理(粗粒度) (03:42)试看
    • 视频:6-8 -Spark Streaming工作原理(细粒度) (07:49)
  • 第7章 Spark Streaming核心概念与编程 试看7 节 | 50分钟
  • 本章节将讲解Spark Streaming中的核心概念、常用操作,通过Spark Streaming如何操作socket以及HDFS上的数据让大家进一步了解Spark Streaming的编程
  • 收起列表
    • 视频:7-1 -课程目录 (01:35)
    • 视频:7-2 -核心概念之StreamingContext (11:51)试看
    • 视频:7-3 -核心概念之DStream (05:59)
    • 视频:7-4 -核心概念之Input DStreams和Receivers (06:22)
    • 视频:7-5 -核心概念之Transformation和Output Operations (02:47)
    • 视频:7-6 -案例实战之Spark Streaming处理socket数据 (14:12)
    • 视频:7-7 -案例实战之Spark Streaming处理文件系统数据 (06:29)
  • 第8章 Spark Streaming进阶与案例实战6 节 | 54分钟
  • 本章节将讲解Spark Streaming如何处理带状态的数据,通过案例让大家知道Spark Streaming如何写数据到MySQL,Spark Streaming如何整合Spark SQL进行操作
  • 收起列表
    • 视频:8-1 -课程目录 (02:06)
    • 视频:8-2 -实战之updateStateByKey算子的使用 (12:00)
    • 视频:8-3 -实战之将统计结果写入到MySQL数据库中 (17:43)
    • 视频:8-4 -实战之窗口函数的使用 (05:23)
    • 视频:8-5 -实战之黑名单过滤 (10:45)
    • 视频:8-6 -实战之Spark Streaming整合Spark SQL操作 (05:17)
  • 第9章 Spark Streaming整合Flume11 节 | 43分钟
  • 本章节将讲解Spark Streaming整合Flume的两种方式,讲解如何在本地进行开发测试,如何在服务器上进行测试
  • 收起列表
    • 视频:9-1 -课程目录 (00:51)
    • 视频:9-2 -Push方式整合之概述 (05:56)
    • 视频:9-3 -Push方式整合之Flume Agent配置开发 (03:30)
    • 视频:9-4 -Push方式整合之Spark Streaming应用开发 (05:18)
    • 视频:9-5 -Push方式整合之本地环境联调 (06:09)
    • 视频:9-6 -Push方式整合之服务器环境联调 (05:05)
    • 视频:9-7 -Pull方式整合之概述 (04:11)
    • 视频:9-8 -Pull方式整合之Flume Agent配置开发 (01:54)
    • 视频:9-9 -Pull方式整合之Spark Streaming应用开发 (03:05)
    • 视频:9-10 -Pull方式整合之本地环境联调 (02:50)
    • 视频:9-11 -Pull方式整合之服务器环境联调 (03:38)
  • 第10章 Spark Streaming整合Kafka10 节 | 54分钟
  • 本章节将讲解Spark Streaming整合Kafka的两种方式,讲解如何在本地进行开发测试,如何在服务器上进行测试
  • 收起列表
    • 视频:10-1 -课程目录 (01:27)
    • 视频:10-2 -Spark Streaming整合Kafka的版本选择详解 (04:52)
    • 视频:10-3 -Receiver方式整合之概述 (06:34)
    • 视频:10-4 -Receiver方式整合之Kafka测试 (05:45)
    • 视频:10-5 -Receiver方式整合之Spark Streaming应用开发 (08:36)
    • 视频:10-6 -Receiver方式整合之本地环境联调 (02:31)
    • 视频:10-7 -Receiver方式整合之服务器环境联调及Streaming UI讲解 (08:04)
    • 视频:10-8 -Direct方式整合之概述 (05:39)
    • 视频:10-9 -Direct方式整合之Spark Streaming应用开发及本地环境测试 (06:36)
    • 视频:10-10 -Direct方式整合之服务器环境联调 (03:34)
  • 第11章 Spark Streaming整合Flume&Kafka打造通用流处理基础7 节 | 46分钟
  • 本章节将通过实战案例彻底打通Spark Streaming和Flume以及Kafka的综合使用,为后续项目实战打下坚实的基础
  • 收起列表
    • 视频:11-1 -课程目录 (02:18)
    • 视频:11-2 -处理流程画图剖析 (05:09)
    • 视频:11-3 -日志产生器开发并结合log4j完成日志的输出 (05:50)
    • 视频:11-4 -使用Flume采集Log4j产生的日志 (14:19)
    • 视频:11-5 -使用KafkaSInk将Flume收集到的数据输出到Kafka (09:10)
    • 视频:11-6 -Spark Streaming消费Kafka的数据进行统计 (03:29)
    • 视频:11-7 -本地测试和生产环境使用的拓展 (05:14)
  • 第12章 Spark Streaming项目实战20 节 | 173分钟
  • 本章节将通过一个完整的项目实战让大家学会大数据实时流处理的各个环境的整合,如何根据业务需要来设计HBase的rowkey
  • 收起列表
    • 视频:12-1 -课程目录 (04:05)
    • 视频:12-2 -需求说明 (03:47)
    • 视频:12-3 -用户行为日志介绍 (13:40)
    • 视频:12-4 -Python日志产生器开发之产生访问url和ip信息 (13:15)
    • 视频:12-5 -Python日志产生器开发之产生referer和状态码信息 (08:48)
    • 视频:12-6 -Python日志产生器开发之产生日志访问时间 (02:16)
    • 视频:12-7 -Python日志产生器服务器测试并将日志写入到文件中 (05:45)
    • 视频:12-8 -通过定时调度工具每一分钟产生一批数据 (06:00)
    • 视频:12-9 -使用Flume实时收集日志信息 (09:10)
    • 视频:12-10 -对接实时日志数据到Kafka并输出到控制台测试 (06:15)
    • 视频:12-11 -Spark Streaming对接Kafka的数据进行消费 (07:46)
    • 视频:12-12 -使用Spark Streaming完成数据清洗操作 (17:25)
    • 视频:12-13 -功能一之需求分析及存储结果技术选型分析 (09:08)
    • 视频:12-14 -功能一之数据库访问DAO层方法定义 (05:03)
    • 视频:12-15 -功能一之HBase操作工具类开发 (12:15)
    • 视频:12-16 -功能一之数据库访问DAO层方法实现 (07:15)
    • 视频:12-17 -功能一之将Spark Streaming的处理结果写入到HBase中 (08:03)
    • 视频:12-18 -功能二之需求分析及HBase设计&HBase数据访问层开发 (06:32)
    • 视频:12-19 -功能二之功能实现及本地测试 (07:55)
    • 视频:12-20 -将项目运行在服务器环境中 (17:54)
  • 第13章 可视化实战14 节 | 114分钟
  • 本章节将通过两种方式来实现实时流处理结果的可视化操作,一是使用Spring Boot整合Echarts实现,二是使用更加炫酷的阿里云产品DataV来实现
  • 收起列表
    • 视频:13-1 -课程目录 (03:23)
    • 视频:13-2 -为什么需要可视化 (05:11)
    • 视频:13-3 -构建Spring Boot项目 (12:08)
    • 视频:13-4 -Echarts概述 (05:51)
    • 视频:13-5 -Spring Boot整合Echarts绘制静态数据柱状图 (09:29)
    • 视频:13-6 -Spring Boot整合Echarts绘制静态数据饼图 (04:28)
    • 视频:13-7 -项目目录调整 (01:55)
    • 视频:13-8 -根据天来获取HBase表中的实战课程访问次数 (10:34)
    • 视频:13-9 -实战课程访问量domain以及dao开发 (06:27)
    • 视频:13-10 -实战课程访问量Web层开发 (06:49)
    • 视频:13-11 -实战课程访问量实时查询展示功能实现及扩展 (14:12)
    • 视频:13-12 -Spring Boot项目部署到服务器上运行 (03:19)
    • 视频:13-13 -阿里云DataV数据可视化介绍 (12:13)
    • 视频:13-14 -DataV展示统计结果功能实现 (17:26)
  • 第14章 Java拓展3 节 | 19分钟
  • 本章节作为扩展内容,将带领大家使用Java来开始Spark应用程序,使得大家对于使用Scala以及Java来开发Spark应用程序都有很好的认识
  • 收起列表
    • 视频:14-1 -课程目录 (01:31)
    • 视频:14-2 -使用Java开发Spark应用程序 (10:08)
    • 视频:14-3 -使用Java开发Spark Streaming应用程序 (06:48)
  • 第15章 补充内容9 节 | 56分钟
  • Spark Streaming整合Kafka的offset管理以及消费语义
  • 收起列表
    • 视频:15-1 -课程目录 (03:32)
    • 视频:15-2 -流处理语义详解 (08:33)
    • 视频:15-3 -Kafka整合SparkStreaming的offsets管理宏观介绍 (09:40)
    • 视频:15-4 -环境准备 (02:57)
    • 视频:15-5 -offset管理演示一 (07:26)
    • 视频:15-6 -offset管理演示二 (09:33)
    • 视频:15-7 -offset管理演示三 (08:34)
    • 视频:15-8 -计算结果一致性 (04:50)
    • 视频:15-9 -补充内容总结 (00:46)
  • 第16章 (讨论群内直播内容分享)Spark流处理面试三两事7 节 | 43分钟
  • 本次分享将从Kafka ack机制、Kafka数据文件存储、不同消费策略从源码的角度进行剖析,帮助同学们掌握在Spark流处理项目中的面试常考点。
  • 收起列表
    • 视频:16-1 SparkStreaming整合Kafka面试常考点梳理 (03:46)
    • 视频:16-2 面试常考点之ack剖析 (07:24)
    • 视频:16-3 面试常考点之Kafka数据存储剖析 (06:40)
    • 视频:16-4 面试常考点之Kafka数据消费策略概述 (03:13)
    • 视频:16-5 面试常考点之基于Range消费策略详解 (06:22)
    • 视频:16-6 面试常考点之基于Range消费策略源码解析 (08:02)
    • 视频:16-7 面试常考点之基于RoundRobin消费策略分析 (06:58)

试用:链接:https://pan.baidu.com/s/1l3jpjwT-KYfkBThtGLHSlA?pwd=5q87
提取码:5q87

① 本软件源自互联网,请勿在未经本软件版权所有者书面授权的情况下用于商业用途。
② 如果您喜欢本软件并准备长期使用,请购买正版,支持软件开发者继续改进和增强本软件的功能。
③ 本软件不保证能兼容和适用于所有 Android 平台和系统,有可能引起冲突和导致不可预测的问题出现,请自行承担使用本软件而导致的风险和后果,发布者本人不对使用此软件负任何责任!
④ 转载本软件,请注明作者及出处!
⑤如果您是本游戏或软件的开发者,且不愿被网友分享发布,请电邮至通知本人以便及时处理,或者联系管理员
⑥本资源仅用于学习交流和试用,请勿用于商业目的及法律许可外的用途,如产生纠纷发布者将不承担任何责任。
时光小站 » Spark Streaming实时流处理项目实战