网友您好, 请在下方输入框内输入要搜索的题目:

题目内容 (请给出正确答案)
多选题
RDD的Transformation不包括以下哪些操作()。
A

map

B

filter

C

save

D

count


参考答案

参考解析
解析: 暂无解析
更多 “多选题RDD的Transformation不包括以下哪些操作()。AmapBfilterCsaveDcount” 相关考题
考题 RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器数组、列表等中的所有元素构成新的RDD。() 此题为判断题(对,错)。

考题 以下哪个函数可以对RDD进行排序()。 A.sortByB.intersectionC.filterD.distinct

考题 SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。 A.transB.reduceC.joinD.cogroup

考题 请问RDD的()操作把RDD所有元素转换成数组并返回到Driver端。 A.zipB.joinC.combineByKeyD.collect

考题 以下哪个函数可以对RDD进行去重()。 A.sortByB.intersectionC.filterD.distinct

考题 以下哪个方法可以创建RDD()。 A.textFileB.parallelizeC.makeRDDD.loadFile

考题 GraphX中()是完整提供边的各种操作类。 A.VertexRDDB.RDD[VertexId,VD]C.RDD[Edge]D.EdgeRDD

考题 GraphX中()是存放着Edg对象的RDD。 A.VertexRDDB.RDD[VertexId,VD]C.RDD[Edge]D.EdgeRDD

考题 Dstream输出操作中foreachRDD的正确用法是使用rdd.foreachPartition方法创建一个单独的连接对象,然后使用该连接对象输出所有RDD分区中的数据到外部系统。() 此题为判断题(对,错)。

考题 RDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。() 此题为判断题(对,错)。

考题 以下属于spark启动后进程的是()A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 RDD可以转化为DataFrames,但是DataFrames不能转化为RDD

考题 以下哪些不是rdd的特性()A、心跳机制B、task的分发C、task的回收D、task执行情况的监测

考题 spark中以下哪些特性是rdd的特性()A、计算移动B、数据不移动C、数据移动D、计算不移动

考题 interSection算子对源RDD和参数RDD求交集后返回一个新的RDD

考题 union算子对源RDD和参数RDD求并集后返回一个新的RDD

考题 spark在进行数据切分的时候,决定了partition的哪些属性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

考题 以下关于rdd的特性说法错误的是()A、rdd是仅仅由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 以下关于rdd的说法中,正确的是哪些()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 以下选项属于rdd特性的是()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

考题 Spark中,以下哪些是rdd的特性()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切

考题 以下选项中是persist算子在源码中具有哪些参数的是()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 rdd是由以下哪个选项中结果组成的()A、jobB、driverC、partitionD、worker

考题 以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

考题 单选题Spark组件中哪个选项不属于transformation操作?()A joinB distinctC reduceByKeyD reduce

考题 多选题关于spark说法正确的是()。A调用RDD的Transformation算子可以立即发起jobBNodeManager负责整个集群的资源统一调度和分配。CYarn-client适合测试,Yarn-cluster适合生产。DDataset具有RDD和DataFrame的优点,又避免它们的缺点。

考题 问答题Spark对RDD的操作主要分为行动(Action)和转换(Transformation)两种类型,两种类型操作的区别是什么?