Hadoop 集群具体来说包含两个集群:Hdfs 集群和 Yarn 集群,两者逻辑上分离,但物理上常在一起。

HDFS 集群负责海量数据的存储,集群中的角色主要有:NameNode、DataNode、SecondaryNameNode。

YARN 集群负责海量数据运算时的资源调度,集群中的角色主要有:ResourceManager、NodeManager。


Mapreduce 是什么呢?

它其实是一个分布式运算编程框架,是应用程序开发包,由用户按照编程规范进行程序开发,后打包运行在HDFS 集群上,并且受到YARN集群的资源调度管理。


最后修改: 2023年12月27日 星期三 15:38