1.轉換
變換被用來創造RDD。RDD只能通過變換來創建,它還提供了大量的操作方法,包括map、filter、groupBy、join等。RDD使用這些操作來生成新的RDD,但應該註意的是,無論進行多少次轉換,在RDD計算真實數據之前都不可能真正運行它。
2.行動
Action是數據執行部分,通過執行count、reduce、collect等方法真正執行數據的計算部分。事實上,RDD的所有操作都是以懶惰模式進行的。在編譯中運行時,不會立即計算最終結果,但會記住所有操作步驟和方法,並且只會執行顯示的啟動命令。這樣做的好處是,大部分前期工作已經在轉型期間完成,當Action起作用時,它只需要使用所有的自由來完成業務的核心工作。