首页 > 极速快讯 > 矿圈资讯 > 为科学供给一个去中心化的数据同享空间

为科学供给一个去中心化的数据同享空间

时间: 2022-05-04 来源:极速科技
科学数据的语料库是涣散的、受拜访操控的,它们的迅速添加现已超出了中心化服务的保护才干。点对点技能的最新开展使得树立一个对一切人敞开的永久科学记载档案成为或许。前期,DAOrayaki社区现已编译系列DeSci的文章,在本系列文章中,咱们将深化讨论去中心化文件存储网络的前沿技能,并为协作式去中心化科学ECO供给潜在的开展途径。

常识究竟该为谁所具有?
前史上,人类获取常识的鸿沟,一向遭到调查东西和高质量数据的约束。现在咱们所具有的,对天然界各范畴发生腾跃式了解的才干/权利,之前只归于少量特权阶层。

托勒密用浑天仪和纸莎草纸来记载人类所了解的地球鸿沟,这个鸿沟在曩昔的一千年里没有遭到任何应战。伽利略运用凸透镜和羊皮纸,用一个像被锁定在国际中的神相同的球体,来解说国际的鸿沟。哈勃运用胡克望远镜的力气,为一切的人类常识划定了一个无限扩展的地平线,在一个全部皆有或许的国际里,给后来的真理根究者留下了新的应战。以太坊挖矿


分布式常识,解剖学板块。1857 年 JG Heck

哪怕直到最近,依旧只要那些归于独家学者沙龙的人,才干够得到应对科学范畴严重应战所需的仪器和数据宝库。而今日,敞开式协作和数据同享实践的做法,可以使地舆学和物理学在未来取得更大前进的状况成为或许。这样一些问题太大,杂乱的模型太多,工程应战的难度太高,即使是最开通的人也无法孤军独战处理。咱们对国际规划所累积的了解力会愈加扩展,而高质量的数据集,以及协作数据集所运用的东西,会对咱们每个人、每个当地越来越敞开。

富于数据,贫于才智
尽管地舆学界现已为协作性的敞开科学实践拟定了规范,但许多范畴依然根植于“依据名誉和自我作业开展”的传统做法。对许多人来说,咱们很难知道怎么才干逾越这种对立性根深柢固的学术利益。但是,当今现代科学所面对的实践应战,将迫使它不可避免地引发一场文明革新,这种范式的改变现已跟着今日敞开科学数据同享、期刊和自由软件的呈现而发生。现在咱们在天然国际的科学调查中所取得的数据量成爆破式添加,这种添加已逾越了传统组织根底设施所能供给的,用于保护、存储和挑选逐渐扩展很多原始常识东西的最大承载才干。

关于人类健康、经济活动、社会动态和国际以及咱们对它的影响的,数千PB的名贵数据和调查成果被贮存在过期的存储体系中。这一些数据无法被搜索引擎拜访,存储在只要少量人知道的奥秘方法中,并且或许永久都不会被加以运用。据估量,20世纪90年代搜集的原始科学数据中,有超越80%的数据由于过期的技能和不完善的档案根底设施而永久的消失。哪怕是今日,从一篇论文宣布三年后开端算起,能找到一个数据集的或许性也是以17%的份额呈年年在下降趋势。成心约束科学数据拜访的做法约束了咱们社会的立异速度。比特大陆

去中心化的文件存储协议经过内容可寻址的数据、可编程的数据存储激励机制、出处追寻、抗检查以及跟着全球选用而扩展的带宽,为这种失利供给了处理方案。由这些功用驱动的点对点式的科学数据公域,可以给咱们供给一个有弹性的数字结构,让去中心化的社区会环绕当今最要害和最具应战性的问题坚持认知的一致。

点对点内容网络简史
对等文件同享与互联网相同陈旧。事实上,咱们所知道的互联网的前身 ARPANET 在 1969 年初次启动时,严格来说便是一个点对点网络。网络退化的弹性、高双向带宽、信息冗余、资源聚合和内涵的参加性,是使分布式对等网络成为前期互联网架构师和工程师首选规划的终究的原因。这种直接信息同享的屡次迭代呈现在互联网的时间短前史中。

1973年公钥加密学的呈现标志着身份协议的开端,并经过奇妙的密钥对签名体系对内容做可验证。网络上的用户第一次可以信任由密钥加密的信息包,条件是它是由已知身份揭露发布的密钥的仅有解密。后来,Ralph Merkle 在 1979 年发明晰 Merkle 树,作为一种盯梢信息包来历的办法,为 git 和 svn 等版别操控软件铺平了路途。公钥暗码技能与默克尔树数据结构的归纳,推动了新的立异,例如区块链、分布式核算和一致机制的呈现,这些机制增强了进犯的恢复力,并最大极限地减少了分布式网络中信息碎片化问题。

分布式网络最著名的比如之一,Napster,经过集中式索引服务器衔接对等点,该服务器后来在2001年Metallica因侵略版权提起诉讼后被当局封闭。分布式哈希表 (DHT) 的引进彻底改变了点对点网络的规划,解锁了更高层次的去中心化方法,并使网络在内容审阅跟检查上更具弹性。DHT 开端用于协助在对等网络上各节点方位的彼此回忆,前期的互联网年代,这样的方法会答应点对点网络以真实去中心化的方法扩展,由于它们不需要像 Napster 那样依靠中心化服务器。极受欢迎的点对点网络 BitTorrent 是最早运用 DHT 技能的网络之一。



比特币代码库指纹

2009年,比特币进入了人们的视界。尽管在比特币之前的点对点网络答使用户方便快捷地彼此传输数据,但它们并没有被规划为加密可验证交流的防篡改记载。只要当提交买卖的节点证明他们在短时间内完成了少量的核算作业时,事情才干附加到比特币分类账中。比特币是第一个具有单一大局状况的点对点网络实例,该状况为网络一致的本相做了新的界说,对代表经济价值的加密代币进行搬运。

用于验证分布式网络中事情的加密证明概念为加快点对点技能的立异铺平了路途。星际文件体系 (IPFS) 是一种点对点文件同享协议,它归纳了涣散式核算(如 DHT 和默克尔树)的要害发展和加密证明,为在网络上永久记载存档供给了根底层。IPFS 使信息真实归于网络公共资源成为或许,IPFS经过对内容的修订,对针对数据完整性进犯的纠正,以及对集中式服务供给商强加的带宽瓶颈的批改,促进它具有内涵反抗地舆检查具的才干。

云存储的现状
21世纪初,集中式云服务供给商的呈现,成为网络上内容的把关者。今日,云存储商场被极少量玩家所主导。依据Canalysis(2020年)的估量,亚马逊、微柔和谷歌操控了一半以上的商场,而亚马逊一家就操控了三分之一的商场。亚马逊经过处理前期互联网的要害可扩展性问题,到达其近乎独占的位置,但也正是如此,亚马逊也发明了一系列新的问题,一切这样一些问题都源于集中化。主体问题是资源分配功率低下,数据在孤立的存储库中涣散,缺少隐私和安全,以及不必要的高本钱。总的来说,云服务供给商操控着他们所办理的一切存储数据,使他们成为获取常识的仲裁者。



大型科技公司所选用的操控方法分类

亚马逊最近开端为科学家供给诱人的数据存储买卖,以进一步添加其内容护城河的规划和深度。分析师估测,假如亚马逊可以从工业界、学术界和政府研讨人员那里汇编很多高质量的互操作数据集,他们的服务价值或许会变得更高。例如,艾伦大脑调查站已与亚马逊达成协议,在其云端存储数10TB的名贵神经成像观测成果。

尽管亚马逊为数据上传供给了免费的存储,但从他们的服务器出口往往会发生高额的费用,有时会将数据捕获在他们巨大的核算中心内,并使亚马逊成为公共赞助研讨的实践一切者。社区的反应好像现已让亚马逊考虑为 "合格的 "研讨组织减免每月15%的云存储费用。看来,亚马逊现已从科学出版业吸取了经历,将常识的获取作为其日益扩展的云核算商业方法的另一个有利可图的组成部分。即便如此,一股对立集中化趋势的逆流正在构成,并有望打破大型科技公司在曩昔20年中所树立的操控权柱石。

等待一个愈加敞开性的网络
作为这股逆流的一部分,IPFS促进了许多为去中心化网络供给动力的其他技能立异的呈现。在这一系列文章中,咱们涵盖了首要的去中心化数据存储协议,并评论了它们作为去中心化科学数据公共资源的底层结构的潜力。咱们对IPFS背面的前史、机制和盛行的使用进行了深化的讨论。

引证

Allen Brain Institute. (2018, August 9). Neuroscience Data Joins the Cloud. Retrieved November 21, 2021, from https://alleninstitute.org/what-we-do/brain-science/news-press/articles/neuroscience-data-joins-cloud

Amazon. (2018, July 12th). New AWS Public Datasets Available from Allen Institute for Brain Science, NOAA, Hubble Space Telescope, and Others. Retrieved November 12, 2021, from New AWS Public Datasets Available from Allen Institute for Brain Science, NOAA, Hubble Space Telescope, and Others

Canalysis. (2020, April 29). Global cloud services market Q1 2021. Retrieved November 27, 2021, from https://www.canalys.com/newsroom/global-cloud-market-Q121

Cocks, C. (2001, December). An identity based encryption scheme based on quadratic residues. In IMA international conference on cryptography and coding (pp. 360–363). Springer, Berlin, Heidelberg.

Jocelyn Goldfein and Ivy Nguyen. (2018, March 27). Data is not the new oil. Retrieved 20 November, 2021 from Data is not the new oil — TechCrunch
Merkle, R. C. (1987, August). A digital signature based on a conventional encryption function. In Conference on the theory and application of cryptographic techniques (pp. 369–378). Springer, Berlin, Heidelberg.

Paratii. (2017, October 25). A Brief History of P2P Content Distribution, in 10 Major Steps. Retrieved November 20, 2021, from A Brief History of P2P Content Distribution, in 10 Major Steps | by Paratii | Paratii | Medium
Nakamoto, S. (2008). Bitcoin: A peer-to-peer electronic cash system. Decentralized Business Review, 21260.

Vines, T. H., et. al. (2014). The availability of research data declines rapidly with article age. Current biology, 24(1), 94–97.

Wiener-Bronner, D. (2013, December 23). Most Scientific Research Data From the 1990s Is Lost Forever. Retrieved November, 13, 2021, from Most Scientific Research Data From the 1990s Is Lost Forever — The Atlantic
分享到:
共执行 177 个查询,用时 0.209440 秒,在线 5 人,Gzip 已启用,占用内存 4.277 MB