龙空技术网

各大头部互联网公司都在用的 Apache Kylin™ 到底是什么?

程序员小陶 5570

前言:

此时看官们对“apachekylin语言包”大体比较注意,大家都需要分析一些“apachekylin语言包”的相关内容。那么小编在网摘上搜集了一些有关“apachekylin语言包””的相关知识,希望看官们能喜欢,大家一起来学习一下吧!

预览

Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。

Apache Kylin™令使用者仅需三步,即可实现超大数据集上的亚秒级查询。

1定义数据集上的一个星形或雪花形模型2在定义的数据表上构建cube3使用标准SQL通过ODBC、JDBC或RESTFUL API进行查询,仅需亚秒级响应时间即可获得查询结果

Kylin提供与多种数据可视化工具的整合能力,如Tableau,PowerBI等,令用户可以使用BI工具对Hadoop数据进行分析。

Kylin是什么?

可扩展超快的基于大数据的OLAP引擎:

Kylin是为减少在Hadoop/Spark上百亿规模数据查询延迟而设计

Hadoop ANSI SQL 接口:

作为一个OLAP引擎,Kylin为Hadoop提供标准SQL支持大部分查询功能

交互式查询能力:

通过Kylin,用户可以与Hadoop数据进行亚秒级交互,在同样的数据集上提供比Hive更好的性能

多维立方体(MOLAP Cube):

用户能够在Kylin里为百亿以上数据集定义数据模型并构建立方体

实时 OLAP:

Kylin可以在数据产生时进行实时处理,用户可以在秒级延迟下进行实时数据的多维分析。

与BI工具无缝整合:

Kylin提供与BI工具的整合能力,如Tableau,PowerBI/Excel,MSTR,QlikSense,Hue和SuperSet

其他特性:

Job管理与监控压缩与编码增量更新利用HBase Coprocessor基于HyperLogLog的Dinstinc Count近似算法友好的web界面以管理,监控和使用立方体项目及表级别的访问控制安全支持LDAP、SSO谁在用?Kylin 生态圈

后面会更多关于 Kylin 的入门教程,欢迎关注大数据与机器学习。

标签: #apachekylin语言包