Impala 是 Cloudera 公司主导开发的新型查询系统,它提供 SQL 语义,能查询存储在 Hadoop 的 HDFS 和 HBase 中的 PB 级大数据。

神策分析对开源 Impala 系统进行了深度的改写和优化,基于此构建了实时的用户行为分析引擎,正在为超过 500 家付费客户提供秒级的海量数据查询能力。

本文来自神策数据联合创始人&首席架构师付力力在 QCon 北京全球软件开发者大会上的精彩分享,讲解内容共分四个部分:

  • 什么是用户行为分析
  • 整体架构及数据模型
  • 如何实现实时导入
  • 查询性能的优化

522c55e9b70f57a91296ae366f9a0f4a.pdf