2018年05月21日 星期一
协会动态
优秀安防企业
优秀论文
您当前所在的位置:首页 > 协会动态 > 优秀论文
安防大数据安全隐私现状与挑战
时间:2018-04-18 [ ] 浏览次数:110 来源: 视力保护色:

安防大数据安全隐私现状与挑战

            作者:姚剑波


摘要:从安防大数据特点的基础上出发,分析了安防大数据安全隐私的现状,提出了安防大数据安全隐私面临的挑战。

关键词:安防;大数据;安全隐私


1    前言

安防大数据的来源主要是各地每天产生的数以万计的图像及视频数据,囊括公安、交警、城管、海关、能源、金融、教育、园区、住宅、娱乐场所等地方所获取的视频监控数据,而随着各地视频接入规模从几千到几十万规模化的增长,以及安防监控对高清、智能、联网的要求越来越高,每天产生的数据量正以惊人的速度在不停地累积,给数据隐私和安全带来了很大挑战。

2    安防大数据特点

  在安防行业,涉及的数据信息类型很多,以数据的结构类型来看,包括了各类非结构化、结构化以及半结构化信息。非结构化数据主要指视频录像和图片记录,如监控视频录像,报警录像,摘要录像,车辆卡口图片,人脸抓拍图片,报警抓拍图片等;结构化数据则包括报警记录,系统日志记录,运维数据记录,摘要分析结构化描述记录,以及各种相关的信息数据库,如人口信息,地理数据信息,车驾管信息等;半结构化数据则如人脸建模数据,指纹记录等。

安防行业的信息检索侧重于图形图像,因此,安防界对于大数据的处理和分析工具主要有两类,一类是对于视频图像等非结构化信息的处理和分析工具,包括视频智能分析工具,视频摘要工具,图像清晰化工具,视频清晰化工具,视频转码工具,视频编辑工具等等。另一类则是对于结构化,半结构化信息的大数据分析处理工具。

大数据技术在安防各领域的应用并不成熟,相关的信息碰撞和挖掘需求也尚未能形成模式。在日渐庞大的数据面前,尚未做到对海量视频数据的综合应用与精准分析。

数据安全是整个IT行业内的难题,在安防领域也不例外,IT领域碰到的安全威胁和各种各样的破坏和攻击,在安防领域同样会遇到。而对于安防领域而言,数据量大,图像信息蕴含的信息量更多,而且还涉及到个人隐私,公共安全等问题。

3    安防大数据安全隐私现状

大数据时代的安全性表现在:

一、网络攻击愈演愈烈。大数据时代的网络攻击是通过各种手段获得政府、企业或者个人的私密数据。数据的收集与保护成为竞争的着力点。从隐私的角度来看,大数据时代把网络大众带入到了一种开放透明的裸奔时代。

二、大数据时代是开放与安全的二元挑战。在大数据获得开放的同时,也带来了对数据安全的隐忧。大数据安全是互联网+”时代的核心挑战,安全问题具有线上和线下融合在一起的特征。

三、难以用有效的方式向用户设定权限,实现角色预设;难以检测、控制开发者的访问行为,防止过度的大数据分析、预测和连接。

大数据时代的网络安全和用户隐私:

一、大数据依托的非关系型数据库缺乏数据安全机制。大数据来源和承载方式多种多样,如物联网、移动互联网、PC以及遍布地球各个角落的传感器,数据分散存在的状态,很难定位和保护所有这些数据的机密。

二、社会工程学攻击带来的安全问题。社会工程学的特点是:无技术性、成本低、效率 高。该攻击与其他攻击的最大不同是其攻击手段不是利用高超的攻击技术,而是利用受害者的心理弱点进行攻击。因为不管大数据多么庞大总也少不了人的管理,如果人的信息安全意识淡薄,那么即使技术防护手段已做到无懈可击,也无法有效保障数据安全。由于大数据的海量性、混杂性,攻击目标不明确,因此攻击者为了提高效率,经常采用社会工程学攻击。

三、是软件后门,也会成为大数据安全的软肋。在软件定义世界的时代,云计算、大数据的基础,软件是IT系统的核心,也就是大数据的核心,所有的后门可能都是开放在软件上面的。

四、文件安全面临极大挑战。文件是整个数据和运行些核心。大多数的用户文件都是在第三方的运行平台中存储的和处理的,这些文件往往包含了很多部门和个人的敏感信息,在安全性和隐私性自然成为一个重要的问题。

五、大数据存储安全问题。大数据会使数据量呈非线性增长,而复杂多样的数据集中存储在一起,多种应用的并发运行以及频繁无序的使用状况,有可能会出现数据类别存放错位的情况,造成数据存储管理混乱或导致信息安全管理不合规范。现有的存储 和安全控制措施无法满足大数据安全需求,安全防护手段如果不能与大数据存储和应用安全需求同步升级更新,就会出现大数据存储安全防护的漏洞。

六、大数据安全搜索挑战和问题。需要更高效更智慧的分割数据,搜索、过滤和整理信息的理论与技术,以应对大数据越来越庞大的处理量,特别是实时性数据变化加快,以及非结构化数据品种增多。

七、基于大数据的威胁发现技术挑战。收集各个国家各种类型的数据,利用大数据分析发现潜在危险局势,在攻击发生之前识别威胁。

八、大数据带来的高级可持续攻击挑战。传统的检测是基于单个时间点进行的基于威胁特征的实时匹配检测,而高级可持续攻击(APT)是一个实施过程,无法被实时检测。

九、大数据支撑平台--云计算安全。云计算的核心安全问题是用户不再对数据和环境拥有完全控制权,云环境中用户数据安全与隐私保护难以实现。

十、大数据用户隐私保护考验问题。大数据关键在于数据分析和利用,但数据分析技术的发展,对用户隐私产生极大的威胁。在大数据时代,想屏蔽外部数据商挖掘个人信息是不可能的。

十一、大数据共享安全性问题。不知道该如何分享私人数据,才能既保证数据隐私不被泄漏,又保证数据的正常使用。真实数据不是静态的,而是越变越大,并且随着时间的变化而变化。当前没有一种技术能在这种情况下产生任何有用的结果。

十二、大数据访问控制难题。访问控制是实现数据受控共享的有效手段,由于大数据可能被 用于多种不同场景,其访问控制需求十分突出。难以预设角色,实现角色划分。

十三、大数据的可信性难以保障。网络的数据并非都可信,这主要反映在伪造的数据和失真的数据两个方面。有人可能通过伪造数据来制造假象,进而对数据分析人员进行诱导;或者数据在传播中逐步失真。这可让大数据分析和预测得出无意义或错误的结果。

4    安防大数据安全隐私挑战

一、 安防行业,特别是公安行业对数据的安全性要求非常高,如何保护数据不受外界入侵或非法获取。

二、如何建立安防大数据系统的鲁棒性、体系容错机制,确保硬件在发生故障时数据可以恢复,可以继续保存是一个挑战。

三、在利用安防大数据上,如何保护用户的隐私,也是一个非常重要的课题,目前主要的方法是将数据脱敏后使用。

四、面对海量数据的存储、共享、硬件和软件设备承载的极大安全风险,如何在保证信息安全的前提下,构建大型、海量视频监控存储系统、数据分析系统以及容错冗余机制是安防行业面临的重大考验。

5    安防大数据安全隐私研究方向

一、匿名技术

现有关于非关系型数据发布的隐私保护研究主要包括事物型数据发布的隐私保护、社会网络数据发布的隐私保护、轨迹数据发布的隐私保护以及面向LBS应用的隐私保护数据发布等。数据发布与数据交换已成为大数据背景下隐私保护数据发布成为信息共享中一个极为重要的研究方向。

1)个性化隐私保护数据发布

现有的隐私保护方案大多针对数据持有者,然而记录所有者也有权利和义务保护自己的私自信息,为此没计有效的个性化隐私保护数据发布模型及相关算法是一个重要的研究课题。

2)面向特定应用的隐私保护数据发布

由于数据管理、数据挖掘与信息共享存不同的数据发布形式符相同,可能包括不同的数据表现形式、数据规模、数据更新方式、隐私保障要求等。因此,需要针对不同领域及应用,设计出符合实际要求的隐私保护数据发布模型及算法。

3)大数据背景下的隐私保护数据发布

现有的隐私保护数据发布技术大多假设待发布数据具有相同的数据表现形式,然而在大数据背景下,待发布数据将具有大规模与高速性特征。此外,由于各类数据的相互融合,从而导致待发布数据可能来自不同的数据源,具有不同的数据表现形式。因此,如何针对大数据背景,没计出有效的隐私保护数据发布技术将是一个极具挑战的研究课题。

二、差分隐私

现有的差分隐私模型的两个主要特点:①绝大多数实用模型针对静态数据的发布,未考虑数据动态变化时带来的挑战。而在实际应用中的数据通常随时间动态演化,无法应用到动态数据发布;②差分隐私作为一种新出现的隐私保护框架,能够防止攻击者拥有任意背景知识下的攻击并提供有力的保护,大部分工作仍停留在理论研究上。

目前,面向实时数据发布的差分隐私保护研究中,难点主要有两个难点:一是噪音大,新发布的数据必须包含之前数据发布中包含的噪音,随着发布次数的增加,噪音的累积也不断增加,会使得发布数据与原始数据有着非常大的差异,数据的实用性会极差;二是隐私保护预算的耗尽问题,现有的机制需要预先定义发布的次数,然后分配隐私保护预算,当数据持续更新超出这个次数时,预算被耗尽,发布机制失效。

随着实时数据分析和发布等应用需求的出现和发展,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战。虽然目前国内外有很多研究者在数据发布和分析方面进行了大量卓有成效的工作,特别是解决问题的方法有很多可借鉴之处,但直接针对实时数据分析和发布的隐私保护技术还相当缺乏。

三、数据清洗

当数据集大小适度时,清洗数据的科学方法已经被很好地研究过,但处理海量数据时面临着新的挑战。在小范围应用中,数据清洗常常先从简单的合理性检查开始。是否有明显的错误、丢失、误标记等?能不能从小部分数据采样中发现这些问题?变量的数据值有没有明显的错误?这种检查通常包含从不同角度对数据剖析,通过汇总进行数据扫描,以及设计特定数据快照以识别坏数据。通过这些过程可以鉴定可疑数据条目或者重建丢失的数据值。

面向海量数据时这种方法需要做什么改变呢?合理性检测和潜在问题的鉴定依然可以通过样本和快照来解决,但是如何确定代表性样本有时会引发新的问题。处理这类问题的能力受到时间和数据集大小的限制,而且大部分情况下无法人为干涉。


参考文献

[1]       姚剑波,杨朝琼 主编, 大数据安全与隐私[M]. 成都, 电子科技大学出版社, 2017.

[2]       冯登国,张 敏 李夭. 大数据安全与隐私保护[J]. 计算机学报2014,37(1): 246 - 258.

[3]       大数据安全与隐私保护的问题及对策.http://www.doc88.com/p-1156343729025.html

[4]       (美)马泽尔(Mather,T.),(美)卡玛日萨米尼(Kumaraswamy, S.),  (美)拉提夫(Latif,S.)著;刘戈舟,杨泽明,刘宝旭译.云计算安全与隐私. 北京:机械工业出版社,2011.

[5]       康海燕著. 网络隐私保护与信息安全. 北京:人民邮电出版社,2016.

[6]       吴英杰著. 隐私保护数据发布:模型与算法. 北京:清华大学出版社,2015.

[7]       刘英华著. 基于数据发布的隐私保护模型研究. 北京:中国社会科学出版社,2015.

[8]       (英)迈尔-舍恩伯格,(英)库克耶著;盛杨艳,周涛译. 大数据时代. 杭州:浙江人民出版社,2013.

[9]        (英)帕克(Parker, J.)著;关立深译.全民监控:大数据时代的安全与隐私困境. 北京:金城出版社,2014.

更多
联系电话:0851-85401175 、85401439    仿表
技术支持:88必发   黔ICP备10003997号-1   站点统计:2261914    今天:5092

贵公网安备 52010202000555号