Spark

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出和结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法

排序：

时间投票

0

推荐

1786

阅读

Spark运行后kerveros无法认证，hadoop登录失败

原因：JavaSparkContext sc = null;这个类在开启以后会一直存在后台，如果不执行sc.stop();方法，将一直运行到整个JVM关闭。因此在此之后需要用到hadoop的话...

bacckom 发布于永帆的博客 • 2016-03-29 19:08 评论(0)

0

推荐

1478

阅读

Spark大数据强力引擎的N大工具

Spark正在数据处理领域卷起一场风暴。让我们通过本篇文章，看看为Spark的大数据平台起到推波助澜的几个重要工具。　　Spark生态系统众生相　　Apache Spark不...

我在远方发布于我在远方 • 2016-03-23 16:16 评论(0)

«
1
2
3
4
»

887 人关注

最佳回复者

Bob
获得12次推荐
MarsJ
获得8次推荐
牟瑞
获得5次推荐
万里88
获得4次推荐
在学古筝的程序员
获得3次推荐

改版

反馈