Spark大数据商业实战三部曲:内核解密、商业案例、性能调优(第2版)
上QQ阅读APP看书,第一时间看更新

第1篇 内核解密篇

第1章 电光石火间体验Spark 2.4开发实战

本章首先通过一个电影点评系统实战案例来体验一下Spark 2.4的程序代码特点。在1.1节中,我们将使用弹性分布式数据库(Resilient Distributed Datasets,RDD)的方式来编写Spark最基本的程序代码,而在第1.2节中,我们使用DataFrame、DataSet来感受另一种更易用的程序代码风格。