We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
1 parent 49b3bcc commit 1c6d455Copy full SHA for 1c6d455
1 file changed
docs/big-data/Hadoop-MapReduce.md
@@ -0,0 +1,21 @@
1
+ https://hadoop.apache.org/docs/r1.0.4/cn/index.html
2
+
3
4
5
+## MapReduce 概述
6
7
+### 1.1 MapReduce 定义
8
9
+MapReduce是一个<mark>**分布式运算程序的编程框架**</mark>,是用户开发“基于Hadoop的数据分析应用”的核心框架。
10
11
+MapReduce核心功能是将**用户编写的业务逻辑代码**和**自带默认组件**整合成一个完整的**分布式运算程序**,并发运行在一个Hadoop集群上。
12
13
14
15
+### 1.2 MapReduce 优缺点
16
17
+#### 1.2.1 优点
18
19
+1.MapReduce 易于编程:它简单的实现一些接口,就可以完成一个分布式程序,这个分布式程序可 以分布到大量廉价的PC机器上运行。也就是说你写一个分布式程序,跟写 一个简单的串行程序是一模一样的。就是因为这个特点使得MapReduce编 程变得非常流行。
20
21
+2.良好的扩展性 当你的计算资源不能得到满足的时候,你可以通过简单的增加机器来扩展 它的计算能力。 MapReduce优缺点 1.2.1 优点 3.高容错性 MapReduce设计的初衷就是使程序能够部署在廉价的PC机器上,这就要求 它具有很高的容错性。比如其中一台机器挂了,它可以把上面的计算任务 转移到另外一个节点上运行,不至于这个任务运行失败,而且这个过程不 需要人工参与,而完全是由Hadoop内部完成的。 4.适合PB级以上海量数据的离线处理 可以实现上千台服务器集群并发工作,提供数据处理能力。
0 commit comments