20231025学习总结

发布时间 2023-10-26 02:52:50作者: cassebl

1. (多选题) Apache软件基金会最重要的三大分布式计算系统开源项目

Storm
B Spark

Hadoop

Hive

2. (多选题) Spark最主要的优点是()

Spark提供了内存计算
提供了单一数据集操作类型
计算模式只能是MapReduce
基于DAG的任务调度执行机制

3. (多选题) Spark具有的主要特点包括:

运行模式多样
通用性
容易使用
运行速度快

4. (多选题) Spark所采用Executor的优点包括:

利用多线程来执行具体的任务
多线程之间的数据共享

Executor中有一个BlockManager存储模块,有效减少IO开销

存储模块全部都只能在内存中完成

5. (多选题) Scala的特性包括:

运行速度快
Scala具备强大的并发性
Scala语法复杂
Scala兼容Java

二. 单选题(共1题,14.3分)

6. (单选题) 在实际应用中,大数据处理不包括哪些类型?

基于历史数据的交互式查询
基于实时数据流的数据处理
复杂的批量数据处理
基于离线数据的处理