网友您好, 请在下方输入框内输入要搜索的题目:

题目内容 (请给出正确答案)

spark中的rdd是一个()数据集

  • A、弹性分布式
  • B、弹性计算
  • C、运送数据
  • D、心跳

参考答案

更多 “spark中的rdd是一个()数据集A、弹性分布式B、弹性计算C、运送数据D、心跳” 相关考题
考题 Spark可以从()分布式文件系统中读取数据。 A.TachyonB.HiveC.HbaseD.HDFS

考题 下列不属于Google云计算平台技术架构的是()。 A.结构化数据表BigTableB.弹性云计算EC2C.并行数据处理MapReduceD.分布式锁Chubby

考题 Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性

考题 以下关于sparkstreaming说法正确的是()A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构

考题 spark中弹性分布式数据集指的是哪个()A、RDDB、DriverC、MasterD、Map

考题 spark中以下哪些特性是rdd的特性()A、计算移动B、数据不移动C、数据移动D、计算不移动

考题 spark中的弹性分布式数据集相当于java中的()概念A、类B、接口C、方法D、内部类

考题 spark在进行数据切分的时候,决定了partition的哪些属性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

考题 spark的源码是由哪几种语言编写完成的()A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

考题 rdd是spark中个哪个架构提出的概念()A、spark coreB、spark streamingC、mlbaseD、Grophx

考题 描述Spark集群计算中RDD的含义和作用。

考题 与RDD类似,DataFrame也是一个分布式数据容器

考题 RDD特性包含如下哪些?()A、一组分片(Partition),即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表,存储存取每个Partition的优先位置(preferredlocation)

考题 spark框架中,机器学习库的框架是哪个()A、hadoopB、spark?streamingC、mlbaseD、RDD

考题 RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合

考题 worker组件在spark的任务调度中具有以下哪个作用()A、计算数据B、存储数据C、运送数据D、心跳检测

考题 SparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用

考题 spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集A、单机B、集中式C、分布式D、NOSQL

考题 spark中的rdd不存储数据,存储的是()A、业务逻辑B、物理数据C、数据库数据D、物理逻辑

考题 SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD

考题 下列不属于Google云计算平台技术架构的是()A、并行数据处理MapReduceB、分布式锁ChubbyC、结构化数据表BigTableD、弹性云计算EC2

考题 问答题Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。

考题 判断题Spark是基于内存的计算,所有的Spark程序运行过程中的数据只能存储在内存中。A 对B 错

考题 单选题下列不属于Google云计算平台技术架构的是( )。A 并行数据处理MapReduceB 分布式锁ChubbyC 结构化数据表BigTableD 弹性云计算EC2

考题 单选题下列有关RDD的说法中错误的是()。A RDD是一个只读的,可分区的分布式数据集。B RDD默认存储在磁盘,当磁盘不足时,溢写到内存。C RDD数据以分区的形式在集群中存储。D RDD具有血统机制,发生数据丢失时,可快速进行数据恢复。

考题 判断题Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集A 对B 错

考题 问答题描述Spark集群计算中RDD的含义和作用。