Quantcast
Channel: SQLParty » yarn
Browsing latest articles
Browse All 3 View Live

Image may be NSFW.
Clik here to view.

下一代MapReduce框架YARN

第一代的MapReduce框架(MRv1)在大规模应用中逐渐显示出一些劣势,包括各个方面:内存消耗、线程模型、集群规模增大时的扩展性、可用性、性能指标等。简单总结主要有如下几个方面: JobTracker 是 Map-reduce 的集中处理点,存在单点故障。 JobTracker 完成了太多的任务,造成了过多的资源消耗,当 map-reduce job...

View Article


YARN集群搭建

MapReduce v2(YARN)是未来替代MapReduce v1的计算框架,其设计克服了版本一在超大集群环境下的瓶颈,YARN的介绍见这里。 本文介绍YARN集群的搭建,其前提是HDFS集群完成搭建,这里使用NameNode HA来提高可靠性。 注:搭建基于CDH...

View Article


Yarn在Shuffle阶段内存不足问题(error in shuffle in fetcher)

在Hadoop集群(CDH4.4, Mv2即Yarn框架)使用过程中,发现处理大数据集时程序报出如下错误: 13/12/02 20:02:06 INFO mapreduce.Job: map 100% reduce 2% 13/12/02 20:02:18 INFO mapreduce.Job: Task Id : attempt_1385983958793_0001_r_000000_1,...

View Article
Browsing latest articles
Browse All 3 View Live