Impala一个新型查询系统

Impala一个新型查询系统

1、官网。http://impala.apache.org/

2、文档。http://impala.apache.org/overview.html

3、介绍。

优点:

1、Impala不需要把中间结果写入磁盘,省掉了大量的I/O开销。

2、省掉了MapReduce作业启动的开销。MapReduce启动task的速度很慢(默认每个心跳间隔是3秒钟),Impala直接通过相应的服务进程来进行作业调度,速度快了很多。

3、Impala完全抛弃了MapReduce这