kylin

Apache Kylin(麒麟)是由eBay贡献给开源社区的大数据分析引擎,支持在超大数据集上进行秒级别的SQL及OLAP查询,目前是Apache基金会的孵化项目[1]。本文是一系列介绍快速数据立方体计算(Fast Cubing)的第一篇,将从概念上介绍新算法与旧算法的区别以及分析它的优劣。该算法目前正在内部进行测试和改进,将在Apache Kylin 后续版本中发布。源代码已经公开在Kylin的Git代码库中[2],感兴趣的读者可以到相应分支查看。

3
推荐
3191
阅读

Kylin Cube Build 实战笔记

大数据系列课程66讲 Cube Build实战 https://edu.hellobi.com/course/136/play/lesson/2978 笔记1. 交易模型最简单的星型模型(一个事实表,3个维度表)...
0
推荐
2492
阅读

Kylin的优化

大数据系列课程69讲 Kylin 优化笔记 Kylin 的优化Hive优化HBase优化Kylin维度的优化计算引擎的优化Aggregation Group聚合组,是可以用来控制那些cuboids...
1
推荐
2293
阅读

【Kylin实战】邮件报表生成

在cube build完成后,我的工作是写sql生成数据分析邮件报表。但是,问题是这种重复劳动效率低、易出错、浪费时间。还好Kylin提供RESTful API,可以将这种数据...
0
推荐
2457
阅读

【Kylin实战】Hive复杂数据类型与视图

1. 引言在分析广告日志时,会有这样的多维分析需求:曝光、点击用户分别有多少?标签能覆盖多少广告用户?各个标签(标注)类别能覆盖的曝光、点击在各个DSP...
0
推荐
3190
阅读

Apache Kylin 部署之不完全指南

1. 引言Apache Kylin(麒麟)是由eBay开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据。底层存储用的是HBase,...
3
推荐
3332
阅读

Kylin的cube模型

1. 数据仓库的相关概念OLAP大部分数据库系统的主要任务是执行联机事务处理和查询处理,这种处理被称为OLTP(Online Transaction Processing, OLTP),面向的...

相关话题

326 人关注

最佳回复者

改版

反馈