龙空技术网

36氪首发|以流式数据为核心进行实时处理和分析,数据基础设施平台「Timeplus」获高瓴创投领投种子轮融资

36氪 729

前言:

眼前兄弟们对“进行解析”可能比较注重,姐妹们都需要知道一些“进行解析”的相关知识。那么小编同时在网摘上网罗了一些关于“进行解析””的相关知识,希望小伙伴们能喜欢,看官们一起来了解一下吧!

36氪获悉,以流式数据为核心的实时数据分析基础设施平台「Timeplus」已于日前完成种子轮融资。本轮融资由高瓴创投领投。其他共同投资者和专家顾问包括 GIC TMT 投资主管 Jeremy Kranz;前苹果高级副总裁 Rory Sexton,其在过去 20 年负责打造苹果的全球供应链能力;Richard Tibbetts, 实时流式数据库领域专家,现Tableau产品副总裁;BMC 高级副总裁、数字服务和运营管理总经理、Splunk 前副总裁 Margaret Lee。

Timeplus成立于2021年11月底,是新一代面向流式数据为核心的数据基础设施平台,专注实时流式数据分析。

稍作科普,当前大数据分析系统可以大致分为批式(batch)大数据和流式(streaming)大数据两类。其中,批式大数据又被称为历史大数据,流式大数据又被称为实时大数据,不同类型数据的处理时间存在差异。有资料介绍,目前复杂的批量数据处理(batch data processing),通常的时间跨度在数十分钟到数小时之间;基于历史数据的交互式查询(interactive query),通常的时间跨度在数十秒到数分钟之间;基于实时数据流的数据处理(streaming data processing),通常的时间跨度在数百毫秒到数秒之间。

Timeplus创始人王亭向36氪介绍,从行业趋势来看,当前以IoT/机器行为、应用行为、交互行为等代表的实时数据的增长最为迅猛,预计2025年将超过30%。而Gartner也预计超过50%的企业级应用需要实时数据分析能力来提高企业运营效率。与此同时,数据的整体实际利用率却不到5%,实时数据利用率更低,可挖掘潜力和场景也更为巨大。IDC也预计,“企业正在寻求新一代数据基础设施,能够充分满足和拥抱这些实时数据” 。在实际业务上的作用来看,能够契合实时数据利用需求的大数据基础设施可以对内提高企业运营效率,对外更快更好地了解客户、服务客户,从而生产出满足客户需求的高品质产品。

王亭举例介绍,流式大数据基础设施可以在实时供应链可视化和物流监控、智能制造、实时金融欺诈、实时营销和个性化推荐以及智能汽车实时监控等场景起到帮助企业更好利用流式数据的效果。比如在智能汽车实时监控场景,一台智能汽车一天所产生的实时数据可能超过10TB。

所以,对这些巨大的实时流数据、用户驾驶和交互行为的实时分析和监控,可以更加确保汽车的驾驶安全并提升用户体验。进一步解释逻辑,在智能电动车的电池监控场景中,一方面需要在实时电池传感器流数据中迅速基于一些指标统计——如先用最近1个小时内电压低于11V的次数作为初步异常信号,触发实时预警,同时还需结合历史数据做比较(类似天气、时间段和路况的电池异常数据)进一步明确或排除一些分析数据时间过短所产生的错误告警以及细节。

根据王亭的观察,传统的数据处理产品方案无论在性能、延迟以及灵活部署上,均很难有效支持这些需求。这只是一个例子,同样的需求也发生在金融、供应链、营销等等场景中。一句话总结,随着数据量的爆炸性发展,个性化服务、用户体验提升、智能分析、事中决策等复杂的且实时性更强的业务需求对大数据处理技术提出了更高的要求,这也是流式数据基础设施进一步发展的必要性。

具体对比已出现的产品,王亭认为目前大部分面向全量历史数据、集中统一的数据仓库和分析平台,由于要对数据进行大规模全量处理,所以整体对需求的处理用时过长,数据新鲜度(data freshness)往往不能满足用户的时效性需求。所以,以时间为基础的数据实时分析,以及对实时智能化和自动化的响应会成为新的行业趋势。

针对这些痛点,Timeplus想要打造新一代面向时序的流式数据的实时分析平台——即既能高效、低延迟的对实时流式数据和历史数据进行聚合处理,又能提供高级分析场景的产品。在对企业客户对业务价值上,其希望帮助开拓全新的实时数据分析和实时运营自动化场景,体现实时数据驱动业务的价值。

在整体效果上,判断实时流式数据分析平台性能的一个核心指标就是对实时事件数据的处理和分析延迟以及吞吐量。

当前在测试环境下,Timeplus的实时复杂分析的端到端延迟在普通机器上均小于100毫秒, 甚至小于10毫秒,性能超过行业水平20 倍以上,同时实时事件分析的吞吐量可以超过每秒1千万事件。并且,Timeplus的整体部署成本小,可以灵活部署在从云到端,甚至到设备侧,“在完成强大复杂分析功能和卓越性能的同时,数据计算和存储的消耗远远低于目前行业解决方案。”王亭表示。

之所以能做到这样的效果,和Timeplus基于流式优先、融合向量化分析的实时数据分析架构设计息息相关。在底层技术架构上进行拆解,Timeplus设计了一个以时间为核心的统一实时分析引擎,支持多层计算模型,兼顾流式和历史分析。这一引擎的设计目的是让数据实时收集、实时处理以及产生实时洞察的整个过程变得简单和迅速。

首先在速度上,王亭告诉36氪,Timeplus的引擎可以对实时数据做到快速的存储,并反哺其整体分析速度。比如,在让实时数据导入到其流式分析平台的过程中,相较同业其引擎能提升40倍的导入速度。另外,这一引擎能同时处理实时数据和历史数据,使得最新的数据和历史数据联查变得可能而高效,且不需要大量预计算和重复计算。由此可见,这一引擎的作用首先是导入的高效,另外其在处理上也使得整体的分析速度更高。引擎也是公司的核心壁垒之一,在底层支持着整体数据的分析加速。

而且,Timeplus还可以按照特定格式对数据进行存储,这会让数据存储变得一致和高效。在更为具体的效果上,王亭介绍:"时间高度优化的新一代数据存储和分析格式 TDF(Timeplus Data Format),会让数据无论在内存、磁盘还是云存储下,无论是流式分析还是历史分析查询中,都能高度保持一致和高效。不但数据只存一份,而且还能做到超高存储和检索能力,高可用,无数据丢失,同时支持向量化分析 。" 这不但可以大幅降低服务器存储成本,而且让亚秒的实时分析变得可能。

同时,在易用性方面,Timeplus选择SQL作为统一分析查询语言,这会让绝大多数企业客户无需学习和使用新语言,无需编码就可以快速接入数据进行分析探索,获取实时洞察。当然,使用SQL这类标准语言,也会让Timeplus在汇聚不同数据库的数据时更加快速便捷。

另外王亭还强调,Timeplus的特点也并不仅在于速度。其认为,Timeplus作为实时数据基础设施平台的最大价值在于,真正把数据转换成企业的实时决策和实时自动化,促进业务的巨大增长,提升企业竞争力。在具体场景上,Timeplus可以通过自身产品帮助用户进行时间旅行——即用户可以自由查询几个小时前的统计分析情况等。也就是说,这类产品并非空有技术而无场景。针对流式数据的大数据处理、分析平台首先要能满足客户的业务需求,促进相应场景中业务的发展,在此基础上尽可能提升产品性能。

产品架构

据介绍,Timeplus目前已经正式发布Beta版本的产品,吸引了一些全球客户和合作伙伴的参与,如AlphaStream,Aurora耀乘、datapm、gravitydata等。以AlphaStream为例,作为一家巴西金融科技公司,他们使用Timeplus做到了实时股票市场定价。Alpha Stream的执行董事表示:“我们能够简单地将源插入 Timeplus 并开始对流数据编写热查询以获得结果。无需编译和部署代码。我们还可以将结果引导到接收器以在仪表板中使用,甚至可以组合到另一个分析中。这使得原型设计能够非常快速地部署应用程序。”

产品之外,王亭也介绍了公司的整体特点。具体而言,Timeplus团队具备国际化基因,同时积累了较深行业产品和技术经验。其创始团队来自Splunk、SAP和Amazon等业界头部数据平台公司。团队之间的合作时长达到10年。

其中,CEO王亭为Splunk前全球工程副总裁,2012年作为创始人,筹建和发展Splunk第一个海外研发中心,带领上百人团队。早前,其曾在SAP BusinessObjects担任产品工程全球副总裁,负责全球头部的BI平台主打产品线Crystal Reports和Dashboards的产品和研发,同时主导SAP新一代分析可视化平台软件,成为SAP Lumira Cloud的核心部分。另外,王亭也曾在TalkingData担任CTO。公司COO彭伟(William Plummer)毕业哈佛大学商学院,具备20多年在高盛等世界顶级战略咨询公司经验,曾任TalkingData首席战略官,负责公司的战略规划, 管理海外业务线以及KA客户、渠道合作。公司CTO陶刚具备20多年企业软件设计经验,曾担任华为加拿大Distinguished Engineer and Architect。其也是前Splunk总部AI/ML以及数据生态平台部门首席工程师和前SAP商务智能可视化首席架构师。

也因为这些背景和经验,王亭表示,公司接下来的一段时间内会先关注欧美等全球市场。同样由于公司团队在海外多年的积累,目前其已经有金融、供应链、工业互联网以及互联网行业的客户线索。另外,公司也在中国区设有研发团队,正在招募新成员加入Timeplus,也和合作伙伴一起在时机成熟时进行商机探索。

在不久之后,Timeplus也将发布正式的产品,以期触达、服务更多客户。

关于投资:

高瓴创投合伙人李强表示:全球数据增长进入持续爆发阶段,未来3年的增长总量将是过去30年的总和,其中又以流数据占比最高——达到了增长中的30%以上,而现有基础设施难以应对这一数据快速增长下的需求。Timeplus创始团队拥有超过15年的软件行业实战背景,基于多年工程实践和技术创新、打造出的云原生流数据分析平台,能够帮助企业实现更高的业务敏捷性。我们看好Timeplus有机会成为新一代数据分析基础设施,这也是我们为何从种子轮开始支持Timeplus的原因。相信在创始人王亭带领下,Timeplus将以顶尖技术、为更多行业和企业提供持续创新的数据服务能力。

标签: #进行解析