主要内容:

  • 介绍Join的三种实现方式
  • 介绍Spark中的Join策略

主要内容:

  • 介绍 Page Cache
  • 介绍 Kafka Page Cache 的思想

主要内容:

  • 介绍RDD和DataFrame

主要内容:

  • 介绍虚拟机栈

主要内容:

  • 介绍程序计数器

主要内容:

  • 介绍Spark的产生
  • 介绍Spark的基本架构图
  • 介绍Spark的4种提交运行模式
  • 介绍RDD

关于视图

主要内容:

  • 介绍视图,普通视图和物化视图
  • 介绍Hive中的物化视图

主要内容:

  • 介绍OLAP和OLTP区别
  • 介绍Hive的概念、架构,对比内部表和外部表,行存储和列存储

主要内容:

  • 介绍hive的执行计划

主要内容:

  • 介绍Hive中常用的部分函数