首页 人工智能元宇宙大数据 企业智能化 智慧城市 科技 商务
当前位置:首页 > 大数据

邬贺铨:数据要素的开发与利用离不开数据安全

来源:易观智库 发布日期:2024-05-12

数据委概述

中国商业联合会数据分析专业委员会(以下称“中国商联数据委”),成立于2008年4月,是经国务院国有资产监督管理委员会审核同意、中华人民共和国民政部正式批准和登记的中国数据分析行业组织。

中国商联数据委是中国商业联合会下属分支机构。中国商联数据委以数据分析师及数据分析师事务所等从事与数据分析行业相关的团体与个人自愿组成的全国性数据分析行业组织,是中国较早坚持发展专业型、靠专业推动市场的行业组织。

中国数据分析行业现状

一、国务院印发《促进大数据发展行动纲要》2015年9月5日,经李克强总理签批,国务院日前印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已成为国家基础性战略资源。坚持创新驱动发展,加快大数据部署,深化大数据应用,已成为稳增长、促改革、调结构、惠民生和推动政府治理能力现代化的内在需要和必然选《纲要》提出,要加强顶层设计和统筹协调,大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推进数据资源向社会开放,增强政府公信力...

沙龙预告|数据分析思维如何让ChatGPT提升工作效能Ⅱ——实战篇

发挥数字经济促产业链稳定作用

广东印发实施意见进一步深化数字政府改革建设 到2025年全面建成“数字政府2.0”

“数实融合”为长三角中小企业高质量发展开辟新天地

数智赋能经济新业态 智能产业“向阳而生”

数字经济驱动企业融通发展

CPDA数据分析师考试费用调整通知函

数字产业集群加速发展

国家能源局关于加快推进能源数字化智能化发展的若干意见

活动报道|数据分析思维如何让ChatGPT提升工作效能Ⅱ-实战篇

沙龙预告|数据分析思维如何让ChatGPT提升工作效能Ⅱ——实战篇

数“读“企业 | 立白,如何迎战数字时代新营销?

数“读”企业|立白:数字化转型之路

沙龙预告|数据分析思维如何让ChatGPT提升工作效能Ⅱ——实战篇

数“读“企业 | 立白,如何迎战数字时代新营销?

数字化增强保险业内生动力

数“读“企业 | 立白,如何迎战数字时代新营销?

《大模型驱动 AI 全面提速,产业黄金十年投资周期开启》

《共建中国数据分析行业案例库》| 所有的企业都值得用数据分析重新做一次

夯实制造根基,小熊电器以数智制造助力有质增长

“数字+”激荡新动能

数据分析需求登记窗口:帮助解决数据分析业务需求

数据分析业务咨询申请

64个数据分析常用语

微信发布首份“原年人”春节大数据报告

关于举办2023年数据分析行业个人会员执业教育的通知

活动报道|数据分析思维如何让ChatGPT提升工作效能Ⅱ-实战篇

沙龙预告|数据分析思维如何让ChatGPT提升工作效能Ⅱ——实战篇

数“读“企业 | 立白,如何迎战数字时代新营销?

关于冒用中国商业联合会数据分析专业委员会资质的说明

公开课预告| 7·20数据分析思维如何让ChatGPT提升工作效能

“数据要素具有多项属性,包括可见性、易理解性、可链接性、可视性、互操作性、安全性、归属性、开放性和资产性。”在2022北京网络安全大会上,中国工程院院士邬贺铨详细介绍了数据要素的九大基本特征,并阐述了这九大特征与网络安全之间的内在关联。

第一大特征是数据的可见性。通常情况下,安全检测会使用数据可视化来发现异常,可如果将可视化工具部署在公有云上,就意味着数据也要上传到公有云,显然这将带来一定的安全风险。与此同时,部署私有云的成本又相对偏高,因此大量政企机构希望将云化的可视化工具下载到本地终端进行部署,在增加数据可见性的同时,确保数据的安全性。

第二大特征是数据的易理解性。邬贺铨表示,为了让计算机能更好的理解数据,工程师们会对数据进行前期的预处理。比如人脸识别,需要对人脸事先进行标注,区别眼睛、鼻子、耳朵、嘴巴等等,帮助计算机识别五官;再例如智能驾驶,大量道路情况也需要标注红绿灯、斑马线、障碍物等等。不过,目前标注依然需要人工处理,甚至需要外包、众包的参与,这就带来了很大的用户隐私泄漏风险。

尤其是人脸探测、视觉探测、车辆识别等等敏感公共信息,与个人隐私、车辆安全甚至是智慧城市安全息息相关,一旦处置不当很可能会造成较为严重的后果。

第三个特征是数据的可链接性。大数据技术能够将海量异构分布数据结合在一起,实现数据深度地挖掘。在数据链接的过程中,除了依靠流程和管理制度之外,接入数据的权限该如何管理?邬贺铨认为,跨多个应用程序和云服务存储的数据共享需要明确可共享的原则、范围、层次和内容,规定共享程序与审计,只向授权人开放,重要数据的接入认证需要采用数字签名,并且防止员工使用不安全的应用共享敏感数据。

另一方面,随着欧洲《通用数据保护条例》的实施,元数据需要负担起个人身份信息标记、数据屏蔽、访问请求和数据管理生命周期管理等功能,显然,应重点保证元数据平台对网络攻击的防御能力。

第四是数据互操作性。数据要流动、要使用才能产生价值,尤其是跨境数据流动,这样才能支撑国际贸易以及科技、教育、文化、产业交流合作。但在数据跨境流动过程中,如何保证国家的安全、商业秘密及个人隐私亟待解决。邬贺铨认为,数据流动的管理首先需明确并确定数据类型,以便在出境口拦截未经批准的敏感数据。其次还需还原数据路径,实施数据处理流程的全链路监控,便于事后追溯。

第五是数据的可信性。深度神经网络是个分类器,当事件和图像处于AI模型辨识分界线或被干扰时会使AI误判。不过对抗样本仅对指定图片和攻击模型生效,可通过区域截图、放大缩小等预处理发现数据被投毒。

事实上,在整个供应链中,数据也很易受到污染而出现失真现象。因此可采用区块链+隐私计算方法,整合订单、发票、物流和资金流等数据,来发现有无造假。

第六是数据的安全性。数据是生产要素,因此要使用加密手段防止数据被窃取或者滥用。但加密在保障安全性的同时,也会带来其他的安全问题,比如黑客可以利用勒索软件对数据进行二次加密。因此需要实时对数据进行审计与版本核对,防止被恶意再加密而被控或被勒索。

另一方面,尽管传统加密技术能够大幅提升数据的安全性,但也在一定程度上阻碍了数据的流转和融合。比如两家企业都希望利用对方的数据,但同时都不愿意把自己原始数据交给对方,此时可以利用多方计算技术,允许各参与方只提交密文分片的前提下,通过既定逻辑共同计算出结果,但不透露各自数据。

第七是数据的资产性。数据是生产要素,需要从数据采集、数据开发利用、数据鉴权、数据应用等全生命周期去保证数据资产的安全性。邬贺铨强调,在所有环节中,特别注意元数据的管理、开发过程的管理、流通过程的管理和运维过程的管理,这些过程需要采用相应的安全技术支持资产安全管理。

第八是数据的归属性。毋庸置疑的是,数据本身是有归属权的,包括持有权、使用权、经营权,关系到数据使用的安全性和合法性。对一个国家而言,数据有主权的含义,因为涉及到国家安全以及社会经济发展的重要内容,每个国家对自己的数据有对外的独立自主权,以及国际事务的参与决策权。

对个人而言,个人的身份、家庭、经济状况、兴趣偏好,以及人脸、指纹、DNA等等生物特征等关键敏感数据,要坚持非必要不能收集原则。即便在个人同意收集使用的前提下,也不意味着个人对数据所有权被转让,使用后应及时删除。

不过,不同于传统资产的是,数据是可复制的,数据使用也基本上可以不留痕迹,这为数据的归属确权带来了很大的困难。

第九是数据的开放性。邬贺铨认为,原则上不涉及国家安全、企业秘密和个人隐私的政务数据,都应该向社会开放,才能发挥更大的价值。但政务数据开放要特别注意个人身份识别和地理位置等隐私保护,在大数据技术日益发达的今天,通过混合不同数据集进行关联分析,可以间接地追踪到个人工作生活等隐私,因此需要进行匿名化等脱敏处理。

邬贺铨强调,数据是重要的生产要素,它的安全性不仅关乎国家安全、国民经济、社会稳定,还跟企业的商业秘密、个人隐私、财产安全密切相关。数据安全不仅是技术问题,还涉及法律、政策、管理、人才、伦理等方面,要面对更多的新挑战,需要在实践中加深认识,加大研究创新力度。