历史版本差异:

1.x版本系列:Hadoop 版本当中的第二代开源版本,主要修复 0.x 版本的一些 Bug 等,该版本已被淘汰

2.x版本系列:架构产生重大变化,引入了 Yarn 平台等许多新特性,是现在使用的主流版本

3.x版本系列: 加入多 Namenode 新特性,对 HDFS、MapReduce、Yarn 都有较大升级,还新增了 Ozone key-value存储。

发行版:

Hadoop 发行版本分为开源社区版商业版。社区版是指由 Apache 软件基金会维护的版本,是官方维护的版本体系。

商业版 Hadoop 是指由第三方商业公司在社区版 Hadoop 基础上进行了一些修改、整合以及各个服务组件兼容性测试而发行的版本,比较著名的有 Cloudera 的CDH、mapR、HortonWorks 等。

1、免费开源版本 Apache:

优点:拥有全世界的开源贡献者,代码更新迭代版本比较快,

缺点:版本的升级,版本的维护,版本的兼容性,版本的补丁都可能考虑不太周到

Apache所有软件的下载地址(包括各种历史版本

2、免费开源版本 HortonWorks:

HortonWorks 主要是雅虎主导 Hadoop 开发的副总裁,带领二十几个核心成员成立 Hortonworks,核心产品软件 HDP(ambari),HDF 免费开源,并且提供一整套的 Web 管理界面,供我们可以通过 Web 界面管理我们的集群状态,2018 年大数据领域的两大巨头公司 Cloudera 和 Hortonworks 宣布平等合并,Cloudera 以股票方式收购 Hortonworks,Cloudera 股东最终获得合并公司60%的股份

3、收费版本

软件收费版本Cloudera:

Cloudera 主要是美国一家大数据公司在 Apache 开源 Hadoop 的版本上,通过自己公司内部的各种补丁,实现版本之间的稳定运行,大数据生态圈的各个版本的软件都提供了对应的版本,解决了版本的升级困难,版本兼容性等各种问题


最后修改: 2023年12月27日 星期三 15:30