大数据应用架构设计和数据流程参考实践方案

软件架构 07-26 239

前言：

如今姐妹们对“kylin 大数据架构”大体比较注重，同学们都需要剖析一些“kylin 大数据架构”的相关知识。那么小编同时在网摘上搜集了一些有关“kylin 大数据架构””的相关内容，希望朋友们能喜欢，小伙伴们一起来了解一下吧！

一、技术选型

针对实际业务场景，选择合适的技术。

数据采集传输：Flume，Kafka，Logstash，DataX，Sqoop数据存储：HDFS，HBase，Hive，MySQL，S3数据计算：MapReduce，Tez，Spark，Storm，Flink数据查询：Drill，Presto，Impala，Kylin

二、系统架构图

日志文件 | MySQL数据表 -->分别由Flume| Sqoop 处理 --> Kafka | HDFS 存储落地；

资源管理由Yarn统一调度；

Hive | Presto | Kylin 负责数据查询;

Oozie | Azkaban 任务调度器；

最后实现可视化展示；

三、系统数据流程

Web/App埋点行为数据 -->log日志服务器 -->logFile格式 -->Flume生产 -->Kafka可以接实时数据、或者Elasticsearch存储 -->Flume消费 -->HDFS存储

业务交互 -->Nginx实现负载均衡 --> Spring Boot业务服务器 -->MySQL 业务数据库 -->Sqoop -->HDFS -->Hive数仓 --> 把结果存储到MySQL

（此处已添加圈子卡片，请到今日头条客户端查看）