如何平衡隐私保护和数据挖掘?政企学研纵论数据生产要素流通交易痛点难点
模型加工场或能解决隐私保护与数据挖掘矛盾。
5月7日,由哈尔滨工业大学(深圳)主办的规范促进数据生产要素流通交易研讨会在深圳召开。与会代表围绕着数据要素时代如何应对流通、交易的规范与痛点展开了全面探讨。来自深圳市人大、市政府相关职能部门的负责人,行业协会和知名企业代表,哈工大(深圳)校领导、相关院系教师代表出席了会议。
随着大数据、人工智能、云计算等新技术在各行业不断深入应用,全球数据呈现爆发增长、海量集聚的特点,数据的价值愈发凸显。2020年4月9日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》正式对外发布,首次将数据与土地、劳动力、资本、技术等传统要素并列。加快培育数据要素市场已经成为共识,但仍面临法律、政策、技术安全等方面的挑战。
数据流通交易面临隐私保护和确权问题
哈工大(深圳)党委书记、深圳高质量发展与新结构研究院创院院长吴德林教授在致辞中提到,哈工大(深圳)积极探讨数据隐私保护、数据确权的规则体系,寻找数据安全运用的技术解决方案。举办这次研讨会旨在促进个人信息保护方面交流互鉴,积极推动数据法治建设,防范打击侵犯个人信息行为,探讨打造安全可靠的数据生态环境,为数据生产要素的流通和交易奠定坚定的基础。
(哈工大(深圳)党委书记吴德林致辞)
全国政协经济委员会副主任、哈尔滨工业大学(深圳)经济管理学院创院院长刘世锦教授在视频发言中指出,数据作为生产要素的流通交易,面临确权和隐私保护两大关键难题。数据本质上是信息,不具备独享性或专享性,多数人可同时占有。数字经济时代,与个人有关的信息传播边际成本几乎为零,能够迅速传遍整个世界,这种低成本使得数据保护面临特殊困难。
他以 5G 建设和运用为例,分析数据作为生产要素如何用起来。他比喻说,“先有路再通车”,5G实际是修建信息的通道。但和4G不同,5G是在道路修建完成后并没有现成的通行车辆,所以需要在修路的同时寻找或制造车辆,发现或创造各类垂直领域的应用场景。他认为, 5G真正的优势在于它的高速率低时延优势,在工业、医疗、交通、港口、矿山、农业等特殊的生产领域场景才能得到体现。数据运用要与5G融合,首先需要找到应用场景。为此,亟需调动各级政府、企业、相关机构和个人拓展5G应用的积极性创造性,重视已有成功案例的示范引领作用。
此外,刘世锦认为,5G的建设应该“适度”,即在应用场景不太多,已建成的5G基站利用率不高的情况下,5G的基站建设不应提出过高的数量指标。
一种解决矛盾的方法:模型加工场
中国工程院院士、哈尔滨工业大学(深圳)首席学术顾问方滨兴教授则从技术解决方案的角度,做了《AI靶场——基于可信平台的模型加工场》的主题演讲。他认为,数据成为新型生产要素的大幕刚刚开启,数据价值挖掘的重要性空前增加。与此同时,随着《数据安全法(草案)》和《个人信息保护法(草案)》的颁布,个人隐私保护受到国家的高度重视。在此背景下,数据流通将面临大数据场景下隐私保护与数据挖掘的矛盾问题,即如何在保护原始数据隐私的前提下,最大限度地挖掘大数据价值。
(现场讨论重点问题:隐私保护与数据挖掘)
为解决这一矛盾,他提出了破局隐私保护与数据挖掘相悖的方法——模型加工场。这是一套系统的解决方案:基于“数据不动程序动”的核心方法,采取网络靶场技术,构建一个可信计算平台,隐私数据能够以裸数据的形式放在该平台中,外部程序只能利用数据进行模型加工,而人员不能进入该模型加工场查看调阅数据;采用“分享价值不分享数据”的关键手段:使用信息过滤技术构建一个“防水堡”,确保外部程序在可信计算平台中计算之后,向外输出的只能是参数之类的宏观信息,而不能是微观的原始数据,由此确保隐私不会泄漏;基于“数据可用不可见”的辅助模式:数据分析师根据经过置换的样本数据进行潜在价值的挖掘分析,即“数据可用不可见”;基于“保留所有权释放使用权”的扩展模式,将所有权与使用权相分离,可信计算平台可提供远程控制模式,让数据的所有者来远程决定其放到平台中的数据向谁赋予使用权,且由可信计算平台来保障被赋予使用权的人只能使用数据来生成相应的模型,以此发挥出模型加工场的作用,达到交易使用权、不触及所有权的目的。该方法可升级数据信托与交易模式,有力支撑大数据国家战略,预期引领大数据挖掘的国际潮流。
针对由谁来建“模型加工场”的问题,方滨兴认为,应该由本身不需要数据的第三方主体来建“模型加工场”,第三方只做服务才可信,有别于拥有海量数据的腾讯、阿里等互联网巨头。同时,围绕这类“模型加工场”如何打破大互联网公司的数据孤岛,方滨兴认为,它有助于解决数据互补性问题,像银行和移动公司之间可能需要互补性数据;而像京东和淘宝,只有当其发现自身的数据竞争力下降时,才有可能需要对方的数据。
公共数据利用需靠良法善治
哈工大(深圳)经济管理学院学术委员会主席、深圳市原副市长唐杰教授表示,数据正日益成为一种资源,具备可交易性和稀缺性,其价值取决于生成、处理数据所附加的劳动以及供求关系。但数据交易的难点在于其权属不易划分、层层附加的数据增值劳动所对应的价值也不易划分。平台公司汇集了有价值但无价格的海量数据,需要法律明确获取数据的规则和限制,可交易的数据种类、数据结构和定价形式。政府部门在行使公权力的过程中,沉淀了大量机构和个人数据,应当将这些数据反馈社会,便利社会应用。建议相关立法解决好数据安全、个人隐私和数据应用的关系,促进数据交易和数字经济健康发展。
(深圳市人大法律专家就数据立法问题发表看法)
深圳市人大常委会法制工作委员会副主任林正茂认为,数据立法需要在个人隐私保护和数据利用之间找到平衡点,既能够保护个人隐私,又能够促进数据产业,真正起到良法善治的作用。数据要素流通形式包括开放、共享、交易,什么情况下进行开放,什么情况下进行共享,什么情况下进行交易——这些形式对应不同的数据主体和不同的场景,如何运用法律进行规制,仍存在若干立法难题。
深圳市发展改革委副主任刘伟发言中称,依据财政伦理,政府原始数据理论上可以免费开放使用,但根据特别需求对数据再加工产生额外成本和新价值时,可考虑合理收费。政府或国企背书成立数据交易平台,能够在市场规范发育的早期阶段,为各方参与有价值数据交易提供信心和动力。
深圳市政务服务数据管理局副局长王耀文提到,深圳市政府希望通过立法为数据要素市场的流通交易提供最基础的法律支撑。其思路是,不可只讲保护不讲发展,也不可只讲发展减弱保护;不可只讲个人数据和公共数据,而要有综合性,注意基础性。尽管立法不能完全解决数据管理的所有问题,但能解决共性问题和基础性问题,如产权、各种数据关系、数据要素市场各类主客体的关系规范等。
(作者:李婷菊 编辑:李莹亮)
21世纪经济报道及其客户端所刊载内容的知识产权均属广东二十一世纪环球经济报社所有。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。