📝0109

Jstarfish · Jstarfish · commit 1c6d45547979 · 2020-01-09T18:55:26.000+08:00
diff --git a/docs/big-data/Hadoop-MapReduce.md b/docs/big-data/Hadoop-MapReduce.md
@@ -0,0 +1,21 @@
+ https://hadoop.apache.org/docs/r1.0.4/cn/index.html 
+
+
+
+##  MapReduce 概述
+
+###  1.1 MapReduce 定义
+
+MapReduce是一个<mark>**分布式运算程序的编程框架**</mark>，是用户开发“基于Hadoop的数据分析应用”的核心框架。
+
+MapReduce核心功能是将**用户编写的业务逻辑代码**和**自带默认组件**整合成一个完整的**分布式运算程序**，并发运行在一个Hadoop集群上。 
+
+
+
+### 1.2 MapReduce 优缺点
+
+#### 1.2.1 优点 
+
+1．MapReduce 易于编程：它简单的实现一些接口，就可以完成一个分布式程序，这个分布式程序可 以分布到大量廉价的PC机器上运行。也就是说你写一个分布式程序，跟写 一个简单的串行程序是一模一样的。就是因为这个特点使得MapReduce编 程变得非常流行。 
+
+2．良好的扩展性 当你的计算资源不能得到满足的时候，你可以通过简单的增加机器来扩展 它的计算能力。 MapReduce优缺点 1.2.1 优点 3．高容错性 MapReduce设计的初衷就是使程序能够部署在廉价的PC机器上，这就要求 它具有很高的容错性。比如其中一台机器挂了，它可以把上面的计算任务 转移到另外一个节点上运行，不至于这个任务运行失败，而且这个过程不 需要人工参与，而完全是由Hadoop内部完成的。 4．适合PB级以上海量数据的离线处理 可以实现上千台服务器集群并发工作，提供数据处理能力。