Impala一个新型查询系统
1、官网。http://impala.apache.org/
2、文档。http://impala.apache.org/overview.html
3、介绍。
优点:
1、Impala不需要把中间结果写入磁盘,省掉了大量的I/O开销。
2、省掉了MapReduce作业启动的开销。MapReduce启动task的速度很慢(默认每个心跳间隔是3秒钟),Impala直接通过相应的服务进程来进行作业调度,速度快了很多。
3、Impala完全抛弃了MapReduce这