实现数据可用不可见,兼顾安全与应用——隐私计算期待良性生态

在数字经济时代,随着人工智能、大数据等产业的快速发展,数据要素的作用及其重要性愈发凸显。与此同时,大量挖掘和收集用户数据与信息,金融领域用户数据信息泄露事件多发。

随着《数据保护法》《个人信息保护法》等的落地,金融业如何做到既保护数据安全,又充分发挥数据资产价值、高效链接多方数据,成为一项亟需解决的课题。

  打破数据孤岛

去年,《数据安全法》《个人信息保护法》先后实施,对数据安全和个人信息保护提出了更严格的要求。与此同时,金融管理部门对于金融业数据安全的执法检查力度加强。严监管趋势下,金融业强化数据应用的安全性与合规性迫在眉睫。

一面是安全,一面是应用,二者如何平衡?今年1月6日发布的《要素市场化配置综合改革试点总体方案》提到,建立健全数据流通交易规则,探索“原始数据不出域、数据可用不可见”的交易范式。隐私计算或成为关键技术。

隐私计算,是一种由两个或多个参与方联合计算的技术和系统,参与方在不泄露各自数据的前提下通过协作对他们的数据进行联合机器学习和分析。在隐私保护计算框架下,参与方的数据不出本地,实现“数据可用不可见”。加拿大工程院及加拿大皇家科学院两院院士杨强表示,隐私计算可以将小数据聚合起来,以“数据可用不可见,数据不动价值动”的形式保障数据安全,发挥数据的价值,进一步提升金融核心业务能力。

“数字经济大潮下,趋严的监管环境对企业及机构在数据保护与数据价值的合理利用之间寻求合理平衡提出了更高要求。”国际咨询机构IDC发布的《IDC创新者,隐私保护计算,2022》报告指出,在数据融合应用和客户隐私保护双重需求驱动下,作为实现数据不动价值动的关键技术,隐私保护计算的应用可以保证参与方的数据不出本地,在保护数据安全的同时实现多源数据的跨域合作,对破解数据保护与融合应用难题提供了可行性思路。

  落地金融场景

目前,金融业是隐私计算商业化应用最为成熟的行业场景之一。金融行业对于数据安全和隐私保护高要求、严监管的现状对隐私计算在金融场景中的落地起到了极大的推动作用。

隐私计算究竟能为金融业做些什么?业内专家介绍,隐私计算能帮助金融机构进一步提高营销转化率与风控效率。如一家银行每天要给5000个用户打电话营销信贷产品,过去的办法是盲选,接到电话的客户很可能并不需要该产品,客户转化效率并不高。而在隐私计算的学习模式中,能够使用数据为客户画像,从用户中筛选出更符合产品定位的客群,进而大幅提高转化效率。这一效果已经在实践中得到验证。

尤其是在当前金融业务形态更加开放的背景下,隐私计算技术正在成为金融业的“刚需”。目前,开放银行是银行业发展的重要方向,数据及数据价值共享是开放金融的基本特征。

如在银行风险控制场景中,传统银行基于历史还款信息、征信数据和第三方数据进行贷前分析。但这一传统办法并不精准,存在数据维度缺乏、数据不足等多重问题。采用隐私计算的银行风控模型可以利用第三方数据来提高模型的有效性,还能同时平衡数据的安全性和隐私性。又如在反洗钱领域,隐私计算能够交换加密参数、联合建模,有效解决反洗钱样本少、数据质量低的问题,形成一个稳健、特征丰富的智能模型。通过调用联合建立的模型,大大提高金融机构反洗钱能力。

中国人民银行今年年初发布的《金融科技发展规划(2022—2025年)》提出了未来8年的八大重点任务,其中格外注重“数据”。规划提出,建设绿色高可用数据中心,布局先进高效的算力体系,进一步夯实金融创新发展的“数字底座”。在保障安全和隐私前提下推动数据有序共享与综合应用,充分激活数据要素潜能,有力提升金融服务质效。

 互联互通是共识

目前,国内隐私计算的主要参与者包括BAT等大型互联网公司以及隐私计算独立技术厂商如星云Clustar、华控清交、数牍科技等。此外,部分金融机构也在通过自研或与隐私计算厂商合作进行探索。

IDC中国金融行业市场分析师王晨认为,目前市场上各主要厂商在路线与定位等方面具备多样性,不同的厂商间有竞争也有互补。接下来,在数据要素有序流通体系的建设方面,需要更多数据参与方一起推动规范与标准的完善,打通因技术差异造成的数据流通壁垒,并确保技术与应用满足穿透式监管的要求,从而形成数据链条中的数据提供商、数据需求方、技术提供方、监管方等不同主体共同参与、有序协作的良性生态体系。

目前,为打通因技术差异造成的壁垒,避免形成“计算孤岛”,互联互通已经成为业内共识。中国信通院联合多家机构编写了《隐私计算跨平台互联互通》系列标准的总体框架,其中就涉及通信规范、互联协议以及应用规范等。

开源也被认为是隐私计算互联互通的实现路径之一。开源基于“开源开放、技术普惠”的逻辑,有助于软件开发降本增效、加速迭代、促进产业协同创新,挖掘数据价值,为各产业技术发展提供动力。中国信通院发布的《隐私计算白皮书(2021年)》指出,开源协同正加速隐私计算的技术迭代。隐私计算作为保障跨机构数据安全合作的关键基础,也注定包含开源模式。开源的成本优势不仅体现在技术复用,降低开发门槛,还体现在问题发现和修复敏捷性上,有利于加速技术升级和商业化项目落地。数据显示,55%的国内隐私计算产品是基于或参考了开源项目。

相关分析认为,隐私计算技术发展和规模化应用的关键是构建生态,让生态各方连接和协作。而开源项目天然具备技术开放性和迭代能力,各方的互联互通成为生态构建的关键。相对于当前不同隐私计算厂商间技术路线的“百花齐放”,基于同一开源框架的互联互通将更有助于隐私计算产业生态的形成。(记者 陈果静)

来源:新华网