Impala 是 Cloudera 公司主导开发的新型查询系统,它提供 SQL 语义,能查询存储在 Hadoop 的 HDFS 和 HBase 中的 PB 级大数据。
神策分析对开源 Impala 系统进行了深度的改写和优化,基于此构建了实时的用户行为分析引擎,正在为超过 500 家付费客户提供秒级的海量数据查询能力。
本文来自神策数据联合创始人&首席架构师付力力在 QCon 北京全球软件开发者大会上的精彩分享,讲解内容共分四个部分:
- 什么是用户行为分析
- 整体架构及数据模型
- 如何实现实时导入
- 查询性能的优化