龙空技术网

聊一聊数据颗粒度这个概念。

图图不nian我 310

前言:

今天大家对“互联网术语 颗粒度”可能比较关注,大家都需要知道一些“互联网术语 颗粒度”的相关内容。那么小编同时在网上网罗了一些对于“互联网术语 颗粒度””的相关资讯,希望各位老铁们能喜欢,你们一起来了解一下吧!

这是一个数据就是黄金的时代,数据如海如山,但是数据到底能不能发挥作用,尤其是在工业领域,能不能通过分析数据来为客户创造价值,就不得不说说数据颗粒度这个概念。

刚开始看到这个名词时,颗粒度从字面意思理解就是要么粗要么细,在网上也搜索了相关解释,看得是云里雾里,没有直观通俗易懂的定义。结合自己的经验加上互联网上零碎的资料,我总结了一下数据颗粒度的几个层面的意思。

数据颗粒度的粗和细。

这个很好理解,以时间间隔多久为例,1分钟采集一次数据和1秒钟采集一次数据,很明显,时间间隔越短,颗粒度越细。又例如针对同一个事件(比如监测机械设备中润滑油的质量变化情况),采集数据的项目有多少项,越多就越细(例子中采集润滑油的粘度、温度与采集润滑油的生产厂家~批次号~粘度~温度~油中颗粒物的含量等等,显然后者更细)。

数据的纯洁性与局限性。

有人会问,数据颗粒度越细越好吗?

我的回答是不好说,为什么呢?

当采集的一组数据中有一些项目与事件毫不相干,更甚者,对数据本身产生极大的干扰,那么你还会觉得颗粒度越细越好吗?所以这里有个纯洁度的概念,怎么理解这个纯洁度,实际上就是数据要有用,不适用的,产生极大干扰的数据项目可以称之为杂质,是需要采集后过滤掉甚至不需要采集,毕竟每增加一个项目就意味着多一个传感器,也就是金钱了!

那为什么又说数据的局限性呢?那是因为采集数据的核心目的是为了后续的分析,并能为企业创造价值。数据采集完成后,当时所有的分析功能都很完美,感觉良好。可是,过一段时间,或者当你来进行更深层次数据挖掘的时候,有没有发现不够用的情况?某一个可能会对分析结果产生影响的项目漏掉了,是不是很可惜。所以这个地方就需要具有前瞻性,或者说需要平衡,那些看似冗余的项目需不需要预留起。可能某一天就有用了呢!

数据颗粒度好还是不好。

相信经过前面的分析,大家心里已经有了答案,颗粒度越细越好,或者纯洁度越高越好都是不正确滴!

结合企业实际情况,颗粒度适中,纯洁度较好,满足企业分析需求,预留一定的发展空间才能称之为数据颗粒度好。

前面第一句就讲数据是这个时代的黄金,实际上流动的数据才是企业的瑰宝,尤其是那些经过分析能为企业创造价值的数据更是无价之宝。

各位友友,希望我的理解也能对你有点帮助,不正确的地方评论区讲!

标签: #互联网术语 颗粒度