当前位置:  首页 →热点 →正文

区块链如何助力数据共享隐私保护?

2018-12-17 12:29:58 华尔街之狼

过去的 20 年,互联网和移动互联网的高速发展,给社会带来给了巨大的变革,给人类生活带来了极大的方便。 互联网科技企业的出现,给消费者提供了无穷无尽、眼花缭乱的产品和服务。我们在享受这些产品和服务的同时,也在时时刻刻向提供商提供关于我们自己的全方位个人信息。数以亿计的用户撑起了全球互联网科技企业超过 9 万亿美元的市值,当互联网愈发呈现寡头化趋势之后, 个人数据更趋于集中,一旦泄露造成的后果也越来越严重。

用户数据隐私保护

中国互联网协会在 2016 年发布的《中国网民权益保护调查报告》显示,2016 年全年国内有 6.88 亿网民曾遭受不同程度的个人信息泄露,造成的经济损失估算达 915 亿元。

今年 1 月份,印度 10 亿公民身份数据库 Aadhaar 被曝遭网络攻击,该数据库除了名字、电话号码、邮箱地址等之外还有指纹、虹膜纪录等极度敏感的信息。

今年 3 月,Facebook 数据泄露丑闻爆发,至少 8700 万用户的隐私数据遭泄露,Facebook 股价在之后下跌超过 20%,。

今年 6 月 19 日,一位 ID 为「f666666」的用户在暗网上开始兜售圆通 10 亿条快递数据,该用户表示售卖的数据为 2014 年下旬的数据,数据信息包括寄(收)件人姓名,电话,地址等信息,10 亿条数据已经经过去重处理,数据重复率低于 20%,并以 1 比特币打包出售。

2018 年 5 月 25 日,欧盟开始强制实施了被称为史上最严苛数据隐私保护法的 GDPR(General Data Protection Regulation,「通用数据保护条例」)。这个新法律条款的制定,规定了企业在对欧盟公民进行数据收集、存储、保护和使用时的新行为标准,也给予了用户对自己数据更广泛的处理权和决定权。其中,现有法律更加偏向于对个人可识别信息(PII) 的保护,而 GDPR 则把范围拓展到了数字世界里的 cookie, device ID, IP 地址等个人行为数据。针对数据收集者,GDPR 规定不能用隐藏默认的方式获取用户许可,必须提前进行明确的提示与询问,获得允许后才可以获取使用用户数据;收集之后还需要为用户提供查看收集数据概览及用途,还必须有用户删除功能。

从我个人之前的投资经历看,我们认为数据行业会分为三个阶段:

1)企业内部数据 - 在过去的十年中,越来越多的企业使用 ERP、SaaS 等系统以及 IoT 设备数据的采集,将企业内部的数据收集、整理并且做有效分析。在未来的三到五年里第一阶段将接近尾声。

2)企业间的数据流通 - 目前我们已经进入了数据的第二阶段即企业间数据的流转,数据的融合可提高其价值,数据的交叉使用可产生协同作用。这将会是未来十年的一个不可逆的趋势。3)最终是个人与企业间的数据流通 - 即 GDPR 所规定的,但是我认为目前距离实现有很长的一段路要走。

众所周知,多方数据共享能产生协同作用。但因为数据本身的可复制性和易传播性,一经分享无法追踪使用情况,数据资产的分享与协同开发受到严重制约。对于数据提供商,大数据分析一般由第三方对各类数 据源进行合并、分析和建模。数据集中化收集导致隐私信息泄露等风险,目前只有 1% 的企业数据向第三方如大数据、AI 公司分享。拥有数据的公司无法安全的将数据共享或变现,产生数 据孤岛。对于数据使用者,大数据公司、开发者和科学家仅能接触到有限的数据集,并且费用高昂。

简单来讲,数据是所见即所得的,目前公链、联盟链均无法解决这个问题。ARPA 就是为了解决数据流转问题而诞生的,我们从 2018 年 3 月到现在已经持续科研和开发 9 个月了。

传统数据分析VS去中心化数据分析

基于前沿的多方安全计算密码学,ARPA 致力于将 Secret Sharing based MPC 与区块链所结合,利用密文运算和区块链透明、不可篡改的属性,赋能多方数据共享,形成数据交易闭环。在保证各方原始数据隐私的同时产生数据协同作用,实现数据的可使用、可追溯但不可见的效能。ARPA 在数据共享中起到的是一个技术 enabler 的角色。

同时,ARPA 利用多方安全计算将区块链解耦为双层架构,可为公链提供隐私性及高可扩展性,大幅提升区块链基础设施性能。ARPA 和公链是合作关系,是一个 Layer 2 隐私解决方案。

那么什么是安全多方计算?安全多方计算研究的是在无可信第三方的情况下,几个相互不信任的参与方如何安全地计算一个约定函数的问题。安全多方计算可在明文数据不离开各自节点的前提下,完成多方协同分析、处理和结果发布。

我们改进优化的 MPC 算法具有可验证性和隐私性。 1)可验证性指,验证方可以花费比运算本身更少的资源去验证运算正确与否的能力。 2)隐私性指,在输入方安全的条件下,参与计算的所有输入不可以被任何攻击者获取,甚至是所有其他参与方合谋的极端情况下仍可保证数据安全。 为了达成这两方面条件,我们使用的密码学算法采用了全阈值秘密分享,并引入信息论安全的信息校验码。另外,零知识证明,部分同态运算及安全通信也是本协议的基本模块。

混淆电路具有高通信量,低通信轮数,可以保护函数的隐私的特点,在两方计算中较为成熟。秘密分享具有高通信轮数,低通信量,最少只需要 1 个诚实节点,可以验证计算结果的特点。

技术上我就不再赘述了,有兴趣的朋友可以看看我们网站 arpachain.io 并和我们交流。那么 MPC 在商业上有什么应用场景呢?

安全多方计算可在明文数据不离开各自节点的前提下,完成多方协同分析、处理和结果发布,适合以下应用场景:多个机构之间想共享数据以供信息联合查询,但又互不信任,每个机构都需要防止数据泄露。利用安全多方计算技术,可以实现数据的安全查询,即在不泄漏任何一方数据的情况下对数据整合和分析。

数据安全查询:政府部门的系统中往往储存了大量的公民个人数据和企业经营数据,很多商业机构需要查询信息用作商业用途,但政府不希望数据被泄露或被拷贝走,同时,有些场景下商业机构也不希望政府知道其查询条件。利用安全多方计算技术,可以实现数据的安全查询。除此之外,数据安全查询的解决方案还可应用在商业竞争、数据合作等众多领域中。

联合征信:安全多方计算可赋能金融、保险企业对客户的负债率等风险指标进行联合分析。目前各家金融、保险、资产管理机构只掌握客户部分数据,从而导致风险评估误差。联合分析不泄露各参与方数据,对客户的风险有整体评估,在多头借贷等场景下能有效降低违约风险。

精准广告投放:安全多方计算赋能商户对潜在客户多维度信息进行分析,从而更精准的投放广告。广告投放机构可以从更多数据维度对客户购买意向建模,且数据源不泄露个人隐私数据。

数据匹配:安全多方计算可完成两方或多方的去中心化数据匹配,数据无需脱敏。

我们的长期目标,是想让每个人把个人数据,包括行为、医疗、健康和基因数据在保护隐私的情况下安全、高效地变现。如此,不仅能让更多人意识到数据的价值,推动社会对个人隐私的守护意识,还能解放大量数据,增加数据流动性,形成双边数据市场,从而更快推动人工智能的发展。

作者:徐茂桐

文章仅作者观点,不代表BB财经立场

BB财经原创,作者华尔街之狼,转载请注明出处:http://www.bbcaijing.cn/news/37511.html