是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架, ,拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS ,因此 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。安装步骤如下:

Continue reading