Impala快速入门

时间:2019-08-25 18:15:17   收藏:0   阅读:76

一.简介

  Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。基于Hive使用内存计算,兼顾数据仓库,具有实时、批处理、多并发的优点。是CDH平台首选的PB级大数据实时查询分析引擎。

二.优点

  1.基于内存计算,能够对PB级别数据进行交互式实时查询、分析

  2.无需转化MR,直接读取HDFS数据

  3.C++编写,LLVM统一编译运行

  4.兼容HiveSQL

  5.具有数据仓库的特点,可直接对hive数据进行分析

  6.支持数据本地化

  7.支持列式存储

  8.支持JDBC/ODBC远程连接

二.缺点

  1.对内存需求大

  2.C++编写,不开源

  3.完全依赖hive

  4.实践表明,当分区超过1W时性能严重下降

  5.稳定性不如hive

 

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!