1. (多选题) Apache软件基金会最重要的三大分布式计算系统开源项目
A Storm
B Spark
C Hadoop
D Hive
2. (多选题) Spark最主要的优点是()
A Spark提供了内存计算
B 提供了单一数据集操作类型
C 计算模式只能是MapReduce
D 基于DAG的任务调度执行机制
3. (多选题) Spark具有的主要特点包括:
A 运行模式多样
B 通用性
C 容易使用
D 运行速度快
4. (多选题) Spark所采用Executor的优点包括:
A 利用多线程来执行具体的任务
B 多线程之间的数据共享
C Executor中有一个BlockManager存储模块,有效减少IO开销
D 存储模块全部都只能在内存中完成
5. (多选题) Scala的特性包括:
A 运行速度快
B Scala具备强大的并发性
C Scala语法复杂
D Scala兼容Java
二. 单选题(共1题,14.3分)
6. (单选题) 在实际应用中,大数据处理不包括哪些类型?
A 基于历史数据的交互式查询
B 基于实时数据流的数据处理
C 复杂的批量数据处理
D 基于离线数据的处理