前言:
而今小伙伴们对“概率论中的p代表什么”可能比较注意,同学们都需要知道一些“概率论中的p代表什么”的相关文章。那么小编在网摘上搜集了一些有关“概率论中的p代表什么””的相关知识,希望看官们能喜欢,看官们一起来了解一下吧!▌撰文 /补寒丹
凯文·凯利在其著作《必然》里写到
“全球经济都在远离物质世界,向非实体的比特世界靠拢。同时,它也在远离所有权,向使用权靠拢;也在远离复制价值,向网络价值靠拢;同时奔向一个必定会到来的世界,那里持续不断发生着日益增多的重混。”
而这一重混所依赖的就是大数据、云计算、物联网、区块链等新技术,他们以科技重构的形式极大地丰富和便利着我们的学习工作生活,让我们每个人接入了一个高效运转的信息智能系统。
但与此同时,以Cookies追踪对用户进行精准的网络行为痕迹分析从而对用户进行量子恒道似的精准投放,甚至以此来窥探用户的政治立场和性取向,并以计算机算法的形式影响用户决策,无疑会让我们每个人都感到恐慌。
近日,在做与大数据相关的课题研究,过程中有以下几个问题甚是疑惑,想要提出来向各位同仁们求教学习。
一、数据与信息的关系
<section style="float: left;background-color: rgb(68, 68, 69);background-image: url(" 640?wx_fmt='png");background-size:' mmbiz.qpic.cn="" 40px;"="" 100%="" zqgb6ea26uhkia2bc7rlkhqtng9kjh5z8tts9ksfokxoecyul5cpiasjeetnuibf5xbushjcojgiapeunp2uogbk6g="" mmbiz_png="">
先摆结论:
数据=信息+冗余数据。
我们在探讨个人信息使用与保护的法律机制建构的时候,总是会把个人数据与个人信息混同并用,因而有不少文章对于数据与信息之间的交叉与界分做了各种详尽论述,力图能够对数据与信息做一个系统性的梳理并找出其具体的细微差别。可读过之后,笔者依然难以区分出数据和信息究竟有何本质区别?因而斗胆从反面出发:我们为何要力图将数据和概念这两个密切相关的概念做一个明确的界分,何不试图融合这两个相似的概念将其融为一体呢?当然,肯定有人认为笔者有模糊概念定义之嫌。
为此,笔者专门咨询了清华大学计算机学院的周康林先生,请教数据与信息在计算机上的各自定义。周先生于是给了我这么个公式,让我一下豁然开朗。我之前对于数据和信息关系的理解仅限于认为数据是信息的载体,信息是数据的表现形式。
而后周先生解释道:
“数据和信息之间是相互联系的。数据是反映客观事物属性的记录,是信息的具体表现形式。数据经过加工处理之后,就成为信息;而信息需要经过数字化转变成数据才能存储和传输。因而以下定义的方式来界分数据与信息其实是没有多大意义的。”
信息量I(x)定义为:
I(x)=log2N=-log2(1/N)=-log2P(x)。
信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。概率论中,用P(x)表示在N个相等的可能事件出现某一个事件的概率,即P(x)=1/N。
而数据则像水一样,它不像信息具有单位。数据与信息并非同等转换关系,但他们确实已然必不可分。
信息的基本作用在于消除人们对事物认知的不确定性,在信息社会形成之前,信息对称或成为一个人的巨大优势所在,而在当代信息社会,一个人几乎可以在网络上找到他想要的任何信息,信息不对称难题已经被攻克。
但现在最大的问题是:信息泛滥之下,对于信息的甄别选择才是一个人新的核心竞争力所在。
当下火热的大数据研究,无非是能通过大数据分析和云计算能够从庞大的数据库中筛选出有价值的信息来,而没有分析挖掘价值的数据则成为了冗余数据。因而笔者认为,没有必要对数据与信息做学理上的严格区分,二者相容不可分,无论个人信息保护法还是个人数据保护法,本质上都指向同一目的:对有价值的可识别的与独立个体相关的信息或数据提供法律上的周延保护。
二、数据的性质探究
数据究竟是应当作为一种权力去行使还是作为一种权利受保护?
➤ 我们首先来看数据权力。
首先提出“数据权力”这一概念的应当是新锐历史学家尤瓦尔赫拉利,他那套著名的三大简史系列已经广为世界所知。尤瓦尔于《未来简史》中提出数据主义和数据权力的概念。
数据是否应当作为一种权力存在?如果真的有数据权力,那又是谁的权力?国家的、企业的、个人的?但不可否认的或许是:数据权很可能成为继一个国家陆权、海权、近地空权、太空权之外最重要的一项国家权力。因而笔者更倾向于认为数据权力将是国家的一项基本权力,对于数据的收集储存开发利用越来越关联着国家的前途命运和国民的福祉利益。
美国作为互联网企业最发达的国家,其数据巨头千方百计通过何种手段收集全球民众的个人数据,甚至通过政府出面与欧盟签订隐私盾协议来获取数据,以及在我国明确规定数据跨境必须经过严格法律程序,谷歌公司立马在华设立数据研究中心,其用意可见一斑。
➤ 接着来看数据权利。
数据是否应成为一项具体的权利?目前国内基本认同数据权利的存在。但具体来说,数据权利到底应作为一项具体的人格权或者财产权或者是知识产权,还是要开辟一项崭新的权利形式则依然存在着学理上的极大争议。
但很有意思的是新《民法总则》第111条里关于个人信息的论述仅仅是说公民个人信息受到法律保护,但并未明确承认个人信息权,所以在立法者看来,是否将个人信息视为与生命权、健康权和隐私权同位阶的法律权利概念,依然存在着很大的考察余地,需要平衡各方利益诉求。
而在笔者看来,自我国2014年成立的中关村大数据交易中心到贵阳成立全国首个大数据交易所,以及之后的上海、武汉等各类大数据交易平台,显然我们已经倾向于将数据视为一项资产,而它是有经济价值的,这是他可以再市场上进行交易的基础。
这里存在的疑惑是,单个个体的数据如果不能汇入大数据云端由算法来进行分析,它其实是没有多少价值粒度的,但当成千上万的数据汇入数据巨头企业的云端系统,它是否必然成为了企业的数据权利,甚至于在进一步,数据是否具备国家属性,这都值得我们进行进一步的探讨。
三、数据的开发利用界线
对大数据进行开发已经成为时之所趋,势之必然。禁止开发利用大数据是绝无可能的,那意味着把自己关在了信息技术革命的大门之外。当下进行大数据开发利用的主要主体是各数据巨头企业,但或许只有当企业挖掘用户数据的成本高于所预期的收益的时候,才能阻止企业进一步开发利用个人数据。
但从目前形势来看,各个数据巨头通过开发利用大数据所得来的经济增益是要远大于其开发成本甚至于违法成本的。互联网的超高速发展与法律的滞后性形成了鲜明对照,法律往往跟不上技术发展的步伐,使得互联网很多空间依然处于法外之地。
互联网与信息技术的发展也使得网络黑灰产业极其“发达”,每年上千亿的潜在犯罪价值吸引着不少急切想要发财致富且意志不坚定的年轻人,甚至于对于公民个人信息的侵犯成为了众多下游犯罪的百罪之源。
而从学术界到实务界,近两年不断提议要赶紧制定个人信息保护法,也是寄望能用法律为技术栓上法治的缰绳,以免技术像一匹脱缰的野马,急速狂奔而不受限制。
大数据+优化算法+廉价的并行计算正在为我们开启一个崭新的互联互通的智能时代,这是大势所趋,我们也难以抗拒智能时代为我们的学习工作生活所提供的巨大便利,但同时也受到了个人信息被侵犯的烦恼(特别是每天无休止的短信电话推销以及精准广告推送)。
于此,曾有学者提出构建国家数据库中心来对个人数据进行统一的开发利用和安全保护。但设立一个统一的综合的总数据中心,其设立规范、运行维护规则,监督管理如何落实到每一个环节都还需要国家法律部门和技术部门的从长计议。
另一方面,我们能否考虑以区块链形式来护航用户隐私安全,区块链节点采用的租户隔离机制、安全合规性的国密算法支持机制以及范围可验证的同态加密机制能更加保护用户隐私安全。在区块链信息分类帐之中,记录的任何信息都在全球范围内进行更新和验证,任何人都可以参与,借助区块链技术,公民可以将私人信息存储在安全,分散的分类账中。公民将维护数据所有权,决定何时何地共享数据。该技术可以防止恶意行为者和第三方在未经同意的情况下访问或获取个人数据。
总而言之,法律既要保证数据的自由流通,更要周延保护公民的合法民事权益。数据隐私问题成为大数据时代不可回避的核心议题,问题解决的关键仍然在于个人信息保护与信息自由流动的利益衡量,而这需要未来在制定相关数据安全保护法的过程中进行精密规范的立法设计。
—— 点击 阅读原文↓,查询法律读库历史推送——
标签: #概率论中的p代表什么