【Spark十四】深入Spark RDD第三部分RDD基本API
编程技术 / houtizong 发布于 3年前 91

对于K/V类型的RDD,如下操作是什么含义？

val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5))rdd.reduceByKey(_+_).collect

reduceByKey在这里的操作，是把RDD中的元素按照Key进行Reduce，因为它是K/V类型的RDD，那么_+_中的_是对Value而言的，最终效果是所有的Value进行相加，具体的过程是加假如ByKey之后得到的数据是<A, v1,v2,v3,v4>, 那么_+_的逻辑是v= v1+v2, v = v + v3, v = v + v4??

什么是Map/Reduce

MapReduce是Google 的一项重要技术，它是一个编程模型，用以进行大数据量的计算。对于大数据量的计算，通常采用的处理手法就是并行计算。至少现阶段而言，对许多开发人员来说，并行计算还是一个比较遥远的东西。MapReduce就是一种简化并行计算的编程模型，它让那些没有多少并行计算经验的开发人员也可以开发并行应用。
MapReduce的名字源于这个模型中的两项核心操作：Map和 Reduce。也许熟悉Functional Programming（函数式编程）的人见到这两个词会倍感亲切。简单的说来，Map是把一组数据一对一的映射为另外的一组数据，其映射的规则由一个函数来指定，比如对[1, 2, 3, 4]进行乘2的映射就变成了[2, 4, 6, 8]。Reduce是对一组数据进行归约，这个归约的规则由一个函数指定，比如对[1, 2, 3, 4]进行求和的归约得到结果是10，而对它进行求积的归约结果是24。

上一篇：【Pig一】Pig入门

下一篇：【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式

请勿发布不友善或者负能量的内容。与人为善，比聪明更重要！

<div  >  <p>&nbsp;</p>  <p><span style="font-size: 16px;">对于K/V类型的RDD,如下操作是什么含义？</span></p>  <p>&nbsp;</p>  <pre name="code" class="java">val rdd = sc.parallelize(List((&quot;A&quot;,3),(&quot;C&quot;,6),(&quot;A&quot;,1),(&quot;B&quot;,5))rdd.reduceByKey(_+_).collect</pre>  <p><span style="font-size: 16px;">&nbsp;reduceByKey在这里的操作，是把RDD中的元素按照Key进行Reduce，因为它是K/V类型的RDD，那么_+_中的_是对Value而言的，最终效果是所有的Value进行相加，具体的过程是加假如ByKey之后得到的数据是&lt;A, v1,v2,v3,v4&gt;, 那么_+_的逻辑是v= v1+v2, v = v + v3, v = v + v4??</span></p>  <p>&nbsp;</p>  <h1>什么是Map/Reduce</h1>  <p><span style="font-size: 16px;">&nbsp;&nbsp;&nbsp; MapReduce是Google 的一项重要技术，它是一个编程模型，用以进行大数据量的计算。对于大数据量的计算，通常采用的处理手法就是并行计算。至少现阶段而言，对许多开发人员来说，并行计算还是一个比较遥远的东西。MapReduce就是一种简化并行计算的编程模型，它让那些没有多少并行计算经验的开发人员也可以开发并行应用。<br />&nbsp;&nbsp;&nbsp; MapReduce的名字源于这个模型中的两项核心操作：Map和 Reduce。也许熟悉Functional Programming（函数式编程）的人见到这两个词会倍感亲切。简单的说来，Map是把一组数据一对一的映射为另外的一组数据，其映射的规则由一个函数来指定，比如对[1, 2, 3, 4]进行乘2的映射就变成了[2, 4, 6, 8]。Reduce是对一组数据进行归约，这个归约的规则由一个函数指定，比如对[1, 2, 3, 4]进行求和的归约得到结果是10，而对它进行求积的归约结果是24。</span></p> </div>

留言需要登陆哦

技术博客集 - 网站简介：
前后端技术：
后端基于Hyperf2.1框架开发,前端使用Bootstrap可视化布局系统生成
网站主要作用：
1.编程技术分享及讨论交流，内置聊天系统;
2.测试交流框架问题，比如：Hyperf、Laravel、TP、beego;
3.本站数据是基于大数据采集等爬虫技术为基础助力分享知识，如有侵权请发邮件到站长邮箱，站长会尽快处理;
4.站长邮箱：[email protected];

文章归档

文章标签

友情链接

首页
关于我们

Auther ·HouTiZong: 侯体宗的博客