Apache Druid，Alibaba Druid，别再傻傻分不清

阿呜的边城 12-25 107

前言：

现在各位老铁们对“如何看到apache在线”都比较关切，大家都想要学习一些“如何看到apache在线”的相关资讯。那么小编在网摘上汇集了一些有关“如何看到apache在线””的相关知识，希望同学们能喜欢，我们快快来学习一下吧！

Apache Druid 是一种开源的分布式实时分析（OLAP）数据库，能够快速地处理海量的数据，并支持在线聚合和深度查询。它主要用于处理所有类型的实时数据，包括日志数据、监控和事件数据、用户行为数据以及其他与时序相关的数据类型。

相比较传统的批量查询引擎，Druid 能够快速查询和分析海量数据，并在实时模式下提供快速的响应，通常仅需要几秒钟的时间可完成复杂的聚合查询请求。

Druid 是由 Metamarkets公司在2011年推出的，并于2012年开始作为开源软件项目公开发布。由于其优秀的性能和灵活性，它已成为许多企业级应用程序的首选数据存储和查询引擎。

关于 Druid，还有一些有趣的故事。听说 Druid 的开发者们最初把它叫作“炼金术士”，因为它的查询速度超快，就像在进行炼金术一样神奇。还有一次，听说有人用 Druid 处理了 500 亿条数据，结果整个数据中心的电脑都被烧坏了，于是这个人只好去买了一批大号的电脑风扇，用来冷却 Druid 的机器。

而类似名字的项目，还有一个 Alibaba Druid。Alibaba Druid 是由阿里巴巴开源的一款分布式实时大数据查询和分析系统，它具有快速、实时、高可用、大规模数据与高并发查询等特点。Alibaba Druid 使用切分数据和基于列的设计来最大化查询性能，可以同时支持实时查询和离线批处理。它可以处理 TB 到 PB 级别的数据，并能够应对复杂的查询场景。

优缺点

Druid 有以下优缺点：

优点：

查询速度快：Druid 拥有极佳的查询效率，可以快速查询百亿级别的数据。实时处理：可以在数据到达时立即进行处理和分析。灵活的数据处理方式：支持多种数据处理方式，包括流式处理、批量处理和增量处理。高度可扩展：可以通过添加多个中间层节点（broker）、数据存储层（historical）、实时数据转换层（realtime）等方式进行水平扩展，具有良好的可扩展性。强大的数据管理和查询接口：支持常见的第三方数据管理工具，如 Apache Superset 和 Tableau，并且具有强大的 REST API 和 SQL 查询接口，使用户可以轻松地查询和管理数据。

缺点：

对查询条件有限制：虽然 Druid 可以快速执行高级操作，但它的查询条件受到限制。例如，不支持多个数据源之间的混合查询。需要管理大量配置：Druid 的配置较为复杂，需要了解许多参数和设置，而且需要进行精细的调整才能达到最佳效果。这可能需要一定的经验和耐心。对数据安全支持有限：Druid 本身不提供数据加密或访问控制的功能，需要用户自己实现这些细节类似框架

市面上有多个与 Druid 类似的分析数据库和大数据引擎，比如：Apache Kylin、Apache Pinot 和 ClickHouse。这些框架在性能、扩展性和易用性方面都有不同程度的优势，但每个框架都有其独特的特点和限制，需要依据自己的业务特性选择最合适的。

小结

我们生活在一个数据爆炸的时代，对于企业而言，高效准确地处理和分析数据是获取竞争优势的核心。Druid 等分析数据库的出现，在数据分析和处理方面提供了更多的选择和可能性。在不断变化的技术潮流和巨大的信息规模下，我们仍需不断探索和创新，以应对前所未有的挑战和机遇。

本文地址：http://www.longkongtuishu.com/ca928BAFsB1EACVRT.html

标签： #如何看到apache在线 #其他电脑连apache