大数据开发技术: 2.1 集群简介

JavaScript is disabled in your browser.
Many features of Moodle will be not usable or will appear to be broken.
Please enable JavaScript for the full Moodle experience.

Hadoop 集群具体来说包含两个集群：Hdfs 集群和 Yarn 集群，两者逻辑上分离，但物理上常在一起。

HDFS 集群负责海量数据的存储，集群中的角色主要有：NameNode、DataNode、SecondaryNameNode。

YARN 集群负责海量数据运算时的资源调度，集群中的角色主要有：ResourceManager、NodeManager。

Mapreduce 是什么呢？

它其实是一个分布式运算编程框架，是应用程序开发包，由用户按照编程规范进行程序开发，后打包运行在HDFS 集群上，并且受到YARN集群的资源调度管理。

最后修改: 2023年12月27日星期三 15:38

上海总部

Tel： 021-56778147

上海静安区共和新路2802号

智苑文创1号楼5层

昆山基地

Tel： 0512-50190290

昆山巴城学院路828号昆山

浦东软件园北楼4、5、8层

杰普软件园

Tel： 0512-57853816

昆山巴城迎宾路祖冲之路

杰普软件园

杰普产品官网

杰普微信订阅号

需要帮助联系我们