龙空技术网

hive on spark,spark sql 对比测试结果相差很大

二十岁背包 366

前言:

此刻姐妹们对“hive和sparksql使用场景”大致比较着重,我们都想要了解一些“hive和sparksql使用场景”的相关内容。那么小编同时在网摘上收集了一些关于“hive和sparksql使用场景””的相关知识,希望兄弟们能喜欢,看官们一起来学习一下吧!

hive on spark ,spark sql 对比测试。

1.数据源:

本测试使用2019-06-20到2019-08-20两个月的数据,总记录数:3232901841.

2.测试对比3.结论

hive on spark 和spark sql测试对比。hive on spark 性能比spark sql差太多。

原因: 1.hive on spark 会把sql解析会rdd的算子,没有经过sparksql的代码优化过程。2.不能使用cache表,来减少IO操作,导致每条sql执行时间都很长。

标签: #hive和sparksql使用场景