主要内容:

  • Spark数据倾斜的几种场景以及对应的解决方案

主要内容:

  • HBase 基础总结

主要内容:

  • 介绍Join的三种实现方式
  • 介绍Spark中的Join策略

主要内容:

  • 介绍 Page Cache
  • 介绍 Kafka Page Cache 的思想

主要内容:

  • 介绍RDD和DataFrame

主要内容:

  • 介绍虚拟机栈

主要内容:

  • 介绍程序计数器

主要内容:

  • 介绍Spark的产生
  • 介绍Spark的基本架构图
  • 介绍Spark的4种提交运行模式
  • 介绍RDD

关于视图

主要内容:

  • 介绍视图,普通视图和物化视图
  • 介绍Hive中的物化视图

主要内容:

  • 介绍OLAP和OLTP区别
  • 介绍Hive的概念、架构,对比内部表和外部表,行存储和列存储