龙空技术网

一种面向百万级数据的热力图生成算法

测绘科学 240

前言:

当前兄弟们对“四叉树算法实现”大概比较关注,看官们都需要剖析一些“四叉树算法实现”的相关知识。那么小编也在网络上搜集了一些有关“四叉树算法实现””的相关文章,希望朋友们能喜欢,姐妹们一起来了解一下吧!

摘要

针对热力图在大量数据的可视化过程中出现的效率低下甚至无法实现的问题,该文提出一种基于像素的热力图生成算法。利用聚类分析对原始数据进行处理,保留数据属性特征的同时有效减少计算量,对于不同的数据级别具有灵活性;采用面向画布区域的灰度叠加计算方法,较大程度地提高运算效率和精度。基于不同量级的全球地震数据和微博签到数据的可视化实验表明:该算法能够有效提高热力图的生成效率,解决了百万级位置数据快速可视化和分析的问题。

引用格式

杨振凯,李响,杨飞. 一种面向百万级数据的热力图生成算法[J]. 测绘科学,2018,43(8):85-89.

正文

随着位置服务(location-based service,LBS)的应用领域不断拓展,位置数据[1](location big data)已成为当前地理国情分析和智慧城市构建的重要战略资源。位置数据因其体量大、数据繁杂的特征,需要借助一些特殊的数据可视化方法进行表达。热力图(heat map)是一种针对一定区域内大量数据点的某一特征的空间态势及分布状况的可视化表达方式,即用图中点的位置来对应地理对象的位置,通过该点的影响因子表示地理对象某要素、特征、属性的数值,并作线性拉伸,在对应的地理对象空间位置上表达出第三维数据值的大小变化特征的方法[2]。第三维数值可以是某种属性、特征,也可不设置任何变量用于反映数据点密度。

目前,国内外对于热力图的研究主要集中在应用方面,例如,Google公司提供输入shape数据自动生成热力图的应用程序编程接口(application programming interface,API)工具[3],百度地图提供实时描述人群分布及密度的热力图服务。另外,文献[4]利用热力图展示了基于基站数据的人口流动量;文献[5]设计实现了一套基于HTMl5技术的热图网络(heat map web)专题地图制作的API;文献[6]利用热力图技术研究区域楼盘的空间分布情况并分析其可行性; 文献[7]利用热力图对地理标签数据进行可视化并分析了其优势。在算法方面,文献[8]在基于地理交通信息的边绑定算法基础上,引入四叉树结构提高了热力图对于人口迁移数据的可视化效率;文献[9]分析了热度计算流程,并提出了带空间约束条件的热图计算方法。热力图因其表达效果明显、用户体验良好的特点,已经成为人们利用多种位置数据对空间环境进行分析认知的重要手段。

虽然现有空间热度分析方法已较为成熟,但更多是将热力图作为一种可视化工具表达某种地理现象,缺少面向大量数据的高效底层算法研究。本文通过总结已有热力图算法及存在的问题,提出一种基于像素点的生成算法,从像素点的角度考虑点数据对象及后续计算过程,采用直接从百万级数据到成图的模式,实时绘制生成热力图。

算法实现流程

热力图是位置数据可视化和分析的重要方法之一。随着微博POI等位置数据集规模的不断增加,如何快速有效地处理海量数据并提取有用的信息成为急需解决的问题。因此,本文提出了一种面向百万级数据的热力图可视化算法,并对整个热力图的生成流程进行了分析与改进。实验证明,该算法能够有效提高热力图的生成效率,使其对百万级位置数据的快速分析和可视化成为可能,为人们在大数据条件下认知地理环境及辅助制订决策提供新的途径。

编辑:邓国臣

往期热点文章

(查找往期消息:进入公众号—号内搜)

觉得不错,请点赞↓↓↓

标签: #四叉树算法实现