博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据技术原理与应用第10讲:Spark
阅读量:4106 次
发布时间:2019-05-25

本文共 1211 字,大约阅读时间需要 4 分钟。

 

Spark单元测验

1单选(2分)

Spark SQL目前暂时不支持下列哪种语言

A.Python

B.Java

C.Matlab

D.Scala

 

2单选(2分)

RDD操作分为转换(Transformation)和动作(Action)两种类型,下列属于动作(Action)类型的操作的是

A.map

B.count

C.groupBy

D.filter

 

 

3单选(2分)

下列说法错误的是

A.RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换

B.Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARN

C.在选择Spark Streaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm

D.RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算

 

4单选(2分)

下列关于常见的动作(Action)和转换(Transformation)操作的API解释错误的是

A.count():返回数据集中的元素个数

B.filter(func):筛选出满足函数func的元素,并返回一个新的数据集

C.take(n):返回数据集中的第n个元素  

(应该是前n个)

D.map(func):将每个元素传递到函数func中,并将结果返回为一个新的数据集

 

5单选(2分)

下列大数据类型与其对应的软件框架不适应的是

A.复杂的批量数据处理:MapReduce

B.基于实时数据流的数据处理:Storm

C.图结构数据的计算:Hive

D.基于历史数据的交互式查询:Impala

 

 

 

 

 

6多选(3分)

Apache软件基金会最重要的三大分布式计算系统开源项目包括

A.Storm

B.Hadoop

C.MapReduce

D.Spark

 

 

7多选(3分)

Spark的主要特点包括

A.运行模式多样

B.运行速度快

C.通用性

D.容易使用

 

8多选(3分)

下列关于Scala的说法正确的是

A.Scala是一种多范式编程语言

B.Scala运行于Java平台,兼容现有的Java程序

C.Scala具备强大的并发性,支持函数式编程

D.Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言

 

9多选(3分)

Spark的运行架构包括

A.集群资源管理器 Cluster Manager

B.每个工作节点上负责具体任务的执行进程 Executor

C.运行作业任务的工作节点 Worker Node

D.每个应用的任务控制节点 Driver

 

10填空(2分)

RDD,中文全称是弹性分布式数据集,是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型。

 

转载地址:http://spssi.baihongyu.com/

你可能感兴趣的文章
Vue动态生成el-checkbox点击无法选中的解决方法
查看>>
python __future__
查看>>
MySQL Tricks1
查看>>
python 变量作用域问题(经典坑)
查看>>
pytorch
查看>>
pytorch(二)
查看>>
pytorch(三)
查看>>
pytorch(四)
查看>>
pytorch(5)
查看>>
pytorch(6)
查看>>
opencv 指定版本下载
查看>>
ubuntu相关
查看>>
C++ 调用json
查看>>
nano中设置脚本开机自启动
查看>>
动态库调动态库
查看>>
Kubernetes集群搭建之CNI-Flanneld部署篇
查看>>
k8s web终端连接工具
查看>>
手绘VS码绘(一):静态图绘制(码绘使用P5.js)
查看>>
手绘VS码绘(二):动态图绘制(码绘使用Processing)
查看>>
基于P5.js的“绘画系统”
查看>>