隐私计算:行业应用潜力巨大,“不愿、不敢、不能”困境待解

21征信+边万莉 2021-11-11 05:00

11月2日-3日,第十六届21世纪亚洲金融年会在北京成功举办。在金融科技分论坛上,隐私计算行业专家和从业机构就“如何保障安全的前提下发挥数据价值”进行了深入的讨论。同时,还指出了隐私计算技术当下面临的困境以及应对之策,畅想未来发展前景。

会上,参与讨论的嘉宾分别是中国信通院云大所大数据与区块链部副主任闫树、中国互联网金融协会信息科技部副主任于圆、星云Clustar副总裁许振、华控清交副总裁杨祖艳、360数科信息安全专家吴业超。

他们一致认为,隐私计算正处于大规模应用的前夜。虽然在实际落地过程中面临着技术性能、合规性、接受度等各种各样的困难,但并非没有解决之道。相比之下,最重要的是如何让市场认知和接受隐私计算的技术理念。

圆桌对话“数据隐私保护与风控迭代”现场。资料图片

兼顾数据安全与效率的技术

据闫树介绍,隐私计算是隐私保护计算的简称,可将其定义概括为——在不传递原始数据或保护原始数据的前提下,实现数据的分析、计算、应用的一类技术集合或体系。目前隐私计算有很多的技术路线,常见的有密码学、可信硬件、联邦学习等。

360数科信息安全专家吴业超指出,隐私计算并不是实现数据安全与有效使用的唯一方式,但目前是较为有效和安全的方式。当前来看,隐私计算还是一个主流,正处于上升阶段,在未来也可能会有更高的成果出现。

许振表示,数据的价值在于融合,样本和维度越多可挖掘的价值越大。隐私计算可以兼顾安全与效率,在数据的融合、确权、流通等方面发挥巨大的作用,将成为未来重要的基础设施。

吴业超提出,保护数据安全应该在最开始的阶段就把安全考虑在内。如,在需求分析阶段把握需求是否合理、产品设计阶段是否规避了风险和漏洞、数据获取阶段是否遵循了法律规范。接下来就是数据的采集、存储、使用阶段。数据采集之后要做好分类分级,将隐私数据、加密数据、可调用数据分别放置在不同的地方,根据分类分级制定不同级别的安全策略,以此来保障数据安全。

杨祖艳表示,数据能够大规模流动的前提是对数据要素使用用途与用量的有效监管,隐私计算除“可用不可见”外,还需要关注其对数据要素使用可控、可计量的特性。

值得一提的是,吴业超介绍了分割式神经网络。据了解,分割式神经网络就是自己去训练自己的模型,自己搭建自己的神经网络,然后依据统一的标准进行输出、碰撞,以此来判断是否符合企业所需要的结果。不仅投资小、占用资源少,广泛性也大。在这个过程中,合作方无需公开数据的加密方式,只需要按照统一标准做结果输出就可以。彼此之间也无法看到对方的原始数据,不仅满足了隐私安全的需求,也满足了成本控制方面的需求,这也是隐私计算的一种。

应用于金融场景下的探索

在闫树看来,隐私计算正处于“大规模应用的前夜”。目前,隐私计算正在慢慢地从技术阶段向应用阶段过渡。越来越多的隐私计算招标项目,尤其是在今年下半年出现了迅猛增长,这在一定程度上代表了技术发展的阶段。

2019年中国人民银行发布《金融科技(FinTech)发展规划(2019-2021年)》(以下简称《规划》),根据规划的顶层设计,中国人民银行自2019年开始组织金融科技创新监管工具的试点,也就是中国版的“监管沙盒”。按照人民银行的要求,互金协会负责项目的初审。于圆说,“在131个已公示的金融科技监管沙盒项目中,有14个项目与隐私计算、多方安全计算相关,占比约为1/10。由此可见,隐私计算行业应用的需求是巨大的。”

从目前隐私计算的实践来看,银行业的需求相对更为迫切。杨祖艳表示,隐私计算在金融领域的应用才刚刚到山脚下,未来大规模应用还需金融机构加强顶层设计,并推动信息科技部、法律合规部、业务部以及数据管理部等协同配合。

银行展业营销是隐私计算的应用场景之一。许振表示,银行在数字化转型的过程中,积累了大量的建模和数据分析人员,对行内数据的使用发挥到了极限。在此背景之下,隐私计算、联邦学习能为银行打开另一扇门,通过引入异业数据的方式,激活创新能力和创新热情,银行在隐私计算平台上可以非常方便地建立不同模型、调整不同参数,应用在营销、贷前、贷中等不同的场景。

“我们是把隐私计算作为一种基础设施来对待。”杨祖艳认为,数据要素大规模流动时代,隐私计算的平台相当于修建了数据流动的高速公路。既然是作为基础设施,就要具备很强的可扩展性,支撑大规模的商业化应用,这在启动期的成本相对比较高的。当达到一定的规模以后,边际成本就能够有效下降。

杨祖艳表示,“虽然这些探索是零星的,但其实非常有意义,探索了未来数据流动的广泛前景,特别是金融这类基础设施好、数据要素密集、数据价值体现充分的行业。这些能够成为引领国家探索数据要素化实践的路径。”

“不愿、不敢、不能”的困境

任何一项技术大规模应用的过程都不是一蹴而就的,隐私计算亦是如此。闫树表示,目前各家企业对隐私计算的应用更多的是属于测试性质,或者是在小系统范围内使用,还没到大规模扩展到全集团、全行业、甚至是跨行业的应用范围,此类案例非常之少。他认为,之所以如此,主要是因为安全性、性能、合规等方面的问题。

于圆表示,金融机构在一些内部研讨会上讨论了隐私计算在应用方面的难点,可以总结为“不愿、不敢、不能”。他解释称,“不愿”主要是业务部门认为在现有生态下,没有必要再用一种新技术去替代已有的数据购买方式。“不敢”是合规部门顾虑在于隐私计算是否如宣传所称的有益具有不确定性,合规部门更希望数据简单直接、不出银行。“不能”是说科技部门仍需提升技术能力以应用隐私计算技术。

许振认为,任何技术的推广首先都是从业务部门出发,先让业务部门了解它的效果。下一步要考虑的就是安全合规性,再是科技部门是否可以使用隐私计算来解决业务问题。隐私计算包含密码学、机器学习等,是一个聚合型技术。虽然可以保护数据隐私安全,且符合监管要求,但代价是成本较高、效率较低。比如,同态加密是非常慢的技术,很难应用到实际生产中,这时就需要有一些加速的方式。

在闫树看来,解决隐私计算面临的上述问题其实有很多种方式,最重要是如何让市场认知和接受隐私计算的技术理念。

于圆提醒,在隐私计算的应用过程中,还要注意保护消费者权益。在隐私计算场景中,虽然个人敏感数据没有泄露,但个人的数字权益在各机构分享的过程中还是被“出卖”了,要注意避免“算法”变“算计”的伦理失范现象。他补充道,现在无论是数据隐私还是风控,都是在找人的缺陷和过失,把一个个活生生的个体变成冷冰冰的数字,长此以往会造成社会撕裂。建议在设计风控模型和算法时,探索引入一些像见义勇为、义务献血和积极参加志愿者活动等正向的数据,开发“白名单”模型和算法。让金融科技充满温度,弥合数字鸿沟,做到科技向善。

(作者:边万莉 编辑:曾芳)

边万莉

记者

关注央行、银行、金融科技等领域,欢迎爆料。微信:bwl1528790429(添加请备注单位及姓名)