Hive专题
第一节 Hive(9月11日)(陈东辉讲)
任务式学习 参照考试列表(计划3-4节*40分钟/每节)
参考书: 下载
Spark专题
第二节 Scala(9月25日)(陈东辉讲)
- 1cala语法编程基础(计划3-4节*40分钟/每节)
第三节 Streaming&Spark SQL&GraphX(10月16日)(第1、2主题于利君讲,第3主题陈东辉讲)
- 1、spark Streaming(计划1节*40分钟/每节)
- 2、Spark SQL and Spark DataFrame(计划2节*40分钟/每节)
- 3、Spark GraphX(计划1节*40分钟/每节)GraphxProgrammingGuide
第四节 MLlib&SparkR(10月30日)(第1主题于利君讲,第2主题陈东辉讲)
- 1、Spark MLlib(计划3节*40分钟/每节)内容包括:ML Pipelines、Extracting, transforming and selecting features、Classification and regression、Clustering、Collaborative Filtering、ML Tuning: model selection and hyperparameter tuning、[Other]
- 2、SparkR(计划1节*40分钟/每节)R on Spark
参考书: 下载