大数据与区块链的联系与区别
- 格式:pdf
- 大小:166.20 KB
- 文档页数:2
⼤数据与区块链的联系与区别
进⼊⼤数据时代,云计算成为⼤数据基础设施,也使得⼤数据的核⼼思想和云计算⼀脉相承。
⼤数据和区块链两者之间有个共同的关键词:分布式,代表了⼀种从技术权威垄断到去中⼼化的转变。
(去中⼼化:在⼀个分布有众多节点的系统中,每个节点都具有⾼度⾃治的特征。
节点之间彼此可以⾃由连接,形成新的连接单元。
任何⼀个节点都可能成为阶段性的中⼼,但不具备强制性的中⼼控制功能。
节点与节点之间的影响,会通过⽹络⽽形成⾮线性因果关系。
这种开放式、扁平化、平等性的系统现象或结构,我们称之为去中⼼化。
)
⼆者联系:
块链让数据真正“放⼼”流动起来
1.数据安全:区块链让数据真正
区块链以其可信任性、安全性和不可篡改性,让更多数据被解放出来。
⽤⼀个典型案例来说明,即区块链是如何推进基因测序⼤数据产⽣的。
区块链测序可以利⽤私钥限制访问权限,从⽽规避法律对个⼈获取基因数据的限制问题,并且利⽤分布式计算资源,低成本完成测序服务。
区块链的安全性让测序成为⼯业化的解决⽅案,实现了全球规模的测序,从⽽推进数据的海量增长。
2.数据开放共享:区块链保障数据私密性
政府掌握着⼤量⾼密度、⾼价值数据,如医疗数据、⼈⼝数据等。
政府数据开放是⼤势所趋,将对整个经济社会的发展产⽣不可估量的推动⼒。
然⽽,数据开放的主要难点和挑战是如何在保护个⼈隐私的情况下开放数据。
基于区块链的数据脱敏技术能保证数据私密性,为隐私保护下的数据开放提供了解决⽅案。
数据脱敏技术主要是采⽤了哈希处理等加密算法。
例如,基于区块链技术的英格码系统(Enigma),在不访问原始数据情况下运算数据,可以对数据的私密性进⾏保护,杜绝数据共享中的信息安全问题。
例如,公司员⼯可放⼼地开放可访问其⼯资信息的路径,并共同计算出群内平均⼯资。
每个参与者可得知其在该组中的相对地位,但对其他成员的薪酬⼀⽆所知。
数据HASH脱敏处理⽰意图
3.数据存储:区块链是⼀种不可篡改的、全历史的、强背书的数据库存储技术
区块链技术,通过⽹络中所有节点共同参与计算,互相验证其信息的真伪以达成全⽹共识,可以说区块链技术是⼀种特定数据库技术。
迄今为⽌我们的⼤数据还处于⾮常基础的阶段,基于全⽹共识为基础的数据可信的区块链数据,是不可篡改的、全历史的、也使数据的质量获得前所未有的强信任背书,也使数据库的发展进⼊⼀个新时代。
4.数据分析:区块链确保数据安全性
数据分析是实现数据价值的核⼼。
在进⾏数据分析时,如何有效保护个⼈隐私和防⽌核⼼数据泄露,成为⾸要考虑的问题。
例如,随着指纹数据分析应⽤和基因数据检测与分析⼿段的普及,越来越多的⼈担⼼,⼀旦个⼈健康数据发⽣泄露,将可能导致严重后果。
区块链技术可以通过多签名私钥、加密技术、安全多⽅计算技术来防⽌这类情况的出现。
当数据被哈希后放置在区块链上,使⽤数字签名技术,就能够让那些获得授权的⼈们才可以对数据进⾏访问。
通过私钥既保证数据私密性,⼜可以共享给授权研究机构。
数据统⼀存储在去中⼼化的区块链上,在不访问原始数据情况下进⾏数据分析,既可以对数据的私密性进⾏保护,⼜可以安全地提供给全球科研机构、医⽣共享,作为全⼈类的基础健康数据库,对未来解决突发疾病、疑难疾病带来极⼤的便利。
5.数据流通:区块链保障数据相关权益
对于个⼈或机构有价值的数据资产,可以利⽤区块链对其进⾏注册,交易记录是全⽹认可的、透明的、可追溯的,明确了⼤数据资产来源、所有权、使⽤权和流通路径,对数据资产交易具有很⼤价值。
⼀⽅⾯,区块链能够破除中介拷贝数据威胁,有利于建⽴可信任的数据资产交易环境。
数据是⼀种⾮常特殊的商品,与普通商品有着本质区别,主要是具有所有权不清晰、 “看过、复制即被拥有”等特征,这也决定了使⽤传统商品中介的交易⽅式⽆法满⾜数据的共享、交换和交易。
因为中介中⼼有条件、有能⼒复制和保存所有流经的数据,这对数据⽣产者极不公平。
这种威胁仅仅依靠承诺是⽆法消除的,⽽这种威胁的存在也成为阻碍数据流通巨⼤障碍。
基于去中⼼化的区块链,能够破除中介中⼼拷贝数据的威胁,保障数据拥有者的合法权益。
另⼀⽅⾯,区块链提供了可追溯路径,能有效破解数据确权难题。
区块链通过⽹络中多个参与计算的节点来共同参与数据的计算和记录,并且互相验证其信息的有效,既可以进⾏信息防伪,⼜提供了可追溯路径。
把各个区块的交易信息串起来,就形成了完整的交易明细清单,每笔交易来龙去脉⾮常清晰、透明。
另外,当⼈们对某个区块的“值”有疑问时,可⽅便地回溯历史交易记录进⽽判别该值是否正确,识别出该值是否已被篡改或记录有误。
⼀切在区块链上有了保障,⼤数据⾃然会更加活跃起来。
⼆者区别:
1.结构化 vs ⾮结构化:
区块链是结构定义严谨的块,通过指针组成的链,典型的结构化数据,⽽⼤数据需要处理的更多的是⾮结构化数据。
2.独⽴ vs 整合:
区块链系统为保证安全性,信息是相对独⽴的,⽽⼤数据着重的是信息的整合分析。
3.直接 vs 间接:
区块链系统本⾝就是⼀个数据库,⽽⼤数据指的是对数据的深度分析和挖掘,是⼀种间接的数据。
4.数学 vs 数据:
区块链试图⽤数学说话,区块链主张“代码即法律”,⽽⼤数据试图⽤数据说话。
5.匿名 vs 个性:
区块链是匿名的(公开账本,匿名拥有者,相对于传统⾦融机构的公开账号,账本保密),⽽⼤数据有意的是个性化。
简⽽⾔之,⼤数据重点是放在数据两字上的,是由各种社会活动产⽣的。
⽽区块链可以理解为是⼀种底层技术,就像是互联⽹⼀样。
不过它把互联⽹做为了⾃⼰的⼀个底层,在互联⽹的底层上搭建了⼀个区块链⽹络,很多⼈也把它叫做“价值互联⽹”。
⽽其中的联系的话⼤数据可以和区块链技术相结合,⽐如区块链有可追溯的特性,⼤数据包在区块链⽹络上交易的时候,能够在全⽹看到它的流向。
能够对这个数据包进⾏确权,跟踪等。
(本⽂转⾃,仅作收藏学习,所有权⼒归原作者所有。
)。