龙空技术网

亚信科技受邀在Apache Hudi中文社区做“数据湖”主题分享

亚信科技 53

前言:

目前大家对“apache中文社区”大体比较注意,同学们都想要知道一些“apache中文社区”的相关知识。那么小编也在网摘上收集了一些有关“apache中文社区””的相关文章,希望朋友们能喜欢,看官们快快来学习一下吧!

近日,Apache Hudi (新一代流式数据湖平台,简称“Hudi”)中文社区举办技术交流会,亚信科技专家受邀分享“数据湖”技术创新实践。

“数据湖”是一种新型的大数据存储和处理技术,它有别于传统的数据仓库技术,无需将数据进行统一规整和结构化处理,在数据查询、实时处理方面效率提升明显。同时,它可以直接在HDFS廉价存储硬件上部署,相较于传统的数据仓库,存储成本大幅下降。这些特性,在数字经济蓬勃发展、数据量爆炸式增长、数据类型和处理需求日渐多样的今天,尤为重要。

Hudi 数据湖平台支持插入、更新、删除以及增量数据处理,能够高效构建“企业级”数据湖,已在国内外多个大型企业落地。亚信科技数据产研中心基于Hudi组件构建大数据湖仓一体架构,自研功能及应用实践获得了Hudi中文社区的关注和充分认可。“亚信科技新技术探索”微信公众号的文章《Hadoop向湖仓一体架构的演进研究》对相关内容做了系统性介绍。

文章介绍了亚信科技基于Hudi湖仓一体架构的应用实践。亚信科技在原有数仓能力的基础上补充了“大规模、准实时分析”能力——相比实时计算,它处理的数据规模更大;相比离线计算,它的数据处理及时性更好。该创新实践填补了“及时性要求在5-60分钟的较大规模的数据处理”这一能力空白。

亚信科技“大数据湖仓一体”解决方案

亚信科技“大数据湖仓一体”解决方案基于自身的Data Infrastructure数据基础设施平台、Data OS数据中台产品,为客户提供高性能异构数据采集入湖、高效数据存储、可视化湖仓数据开发、跨域跨源数据访问、智能化湖仓治理、统一湖仓元数据等特色服务,能够帮助客户构建湖仓一体数据架构,提升数据管理效率、缩短数据加工时延,进而节约成本、助力业务快速增长。

行业案例丰富,应用效果显著

日前,亚信科技采用“湖上建仓”方式,以存量大数据平台为基础,支持国内某通信运营商省公司将原有大数据平台架构升级为具有统一元数据管理、实时/非实时数据统一入湖、跨域数据统一访问、异构数据源统一计算等能力的“湖仓一体”架构。相关业务上线后,系统的数据处理性能提升2倍,数据存储成本降低四分之三,应用效果显著。

标签: #apache中文社区