1.破除数据搜集难题
从数据分析角度来看,海量数据对于得出正确的分析结论有着积极意义。因为只有当数据达到一定量且足够大,才能提供可信的规律分析。但海量数据可能并非使用者希望的数据,也并非有用数据。收集数据是为了发现其背后隐藏的信息、规律,然而现实中,有时所谓的海量数据对分析某一特定问题,恰好是没有价值、毫无意义的冗杂信息。在军事领域,尤其容易发生这种现象。
目前,敌对双方或多方拼命隐真示假甚至有意制造伪信息实施干扰,已成为“战争迷雾”产生的主要原因。诸如此类的现象,决定了有价值情报搜集之难。而要成功运用大数据技术,最重要的前提是必须有可分析的材料,破解数据搜集难题。在平时训练中,如果采集到的数据不准、质量不高,就难以确保评估结果的真实性和有效性;在战时,如果不能及时获取敌方数据信息,
准确辨别敌方的干扰、迷惑或欺骗数据信息,都可能造成误判。因此,在数据搜集方面,需要我们实干、常干、真干。
(1)真干。采集作战数据是一项基础性战备工作,平时下足功夫,战时才能抢占信息优势。但一些单位抓数据库建设“干打雷不下雨”,采集数据停留在口头和报告中,说多做少;有的训练搞得热热闹闹,数据采集“缺斤少两”;有的是采用过去的“老数据”“洋数据”,与作战需求出入较大。要充分认清数据的重要性,增强基于数据指挥作战的意识,把数据采集当作打胜仗的关键来抓,通过各种战场感知平台获取各类作战数据,推进战斗力标准精细化落实。
(2)常干。“流水不腐,户枢不蠹。”作战数据是一项动态建设、不断变化的工程。作战数据完备时鲜,决策指挥就耳聪目明,打起仗来就有底气。数据陈旧、信息过时,放置久了就会“发霉变质”,在战场上就会胡打乱撞,处处受制。有的部队参加实兵对抗演习,用过时数据辅助决策,获取重要信息不够,研判关键信息不准,稀里糊涂打了败仗。“五行不定,输得干干净净。”作战情况越复杂,对信息时效要求就越高。要保证作战数据的鲜活有效,必须摒弃“一劳永逸”的思想观念,实时收集更新作战数据信息。
(3)实干。数据重在运用。有些单位思想认识不到位,“建时重视,用时忽视”;有的数据采集表一大摞,存储加载不及时;有的数据库装的东西多,审校共享拖拉延迟。此类重采集轻使用的问题,影响了数据使用效益。在大数据引领时代发展的大环境下,挖掘运用缺乏深度,作战数据就难以发挥其价值。要解决应用不力的问题,必须增强“能打仗、打胜仗”的责任感和紧迫感,把数据标准立起来、落下去,在“谋数据”中开启战争制胜之门。
2.强化数据管理工作
海量数据通过挖掘、收集、存储、分析,最后被应用在不同行业当中。这当中的众多步骤在管理方面都需要仔细计划,因此,数据管理一直是大数据应用的难题,也是大数据诞生的根本原因。
军事数据管理的基本原则有三个:一是采用共用统建、专用分建,区域部署、综合利用的方法,加快建设采集、存储、处理、传输等数据基础设施;二是突出专业数据采集,加强各类业务数据常态化更新,做到种类齐全、内容丰富、数据准确、实时保鲜;三是注重实践数据积累,为战时运用奠定基础。
从组织上讲,要管理好军事数据,需要做到:
首先得统一数据标准与接口。建立标准化的信息资源共享接口、共享内容、共享链路和共享模式,突破、分割、化解“信息孤岛”,实现高效融合共享。
其次是健全信息资源共享机制。信息资源开发的目的就是为了利用,只有共享才能实现资源增值。应按照信息共享需求,筛选组织、整合共享资源,提供信息分发服务;完善资源配置系统,科学配置、动态调控各类共享资源,实现信息资源的可管控、可处理。具体而言,一是建立信息共享服务机构。建立各类共用信息服务中心,负责从各级各类数据中心抽取共用信息资源,进行生产、加工、存储、分发,提供共用信息服务。二是建立信息共享工作机制。建立各类信息服务的保障机制,提供面向广大官兵的综合信息服务、跨领域跨部门的交互式服务和保障重要对象的专向定制服务。
3.解决数据挖掘难题
现在越来越多的用户开始试图用大数据分析技术来去解决很多问题。一般人认为大数据的优势是指数据规模的海量——随着人类在数据记录、获取及传输方面的技术革命,造成了数据获得的便捷与低成本。但大也有劣势:信息的价值密度低。
这意味着无论是分析人员还是智能系统都需要“大海捞针”,从海量数据中找到有用信息。
其实,大数据的真正价值不在于它的大,而在于它的全面:空间维度上的多角度、多层次信息的交叉复现;时间维度上的与人或社会有机体活动相关联信息的持续呈现。
很多推崇大数据的人认为,“有了足够的数据,数据就可以自己说话”。但数据怎样才能“说话”呢?从理论上讲,数据根本无法自己说话。要让庞大的数据“表达观点”,必须有过硬的软件设计、分析程序,来助力技术分析手段,使数据内隐含的“观点”显现出来。没有符合实际善于淘尽黄沙见真金的分析程序,空有大数据也不能得出正确结论。
这些都说明数据挖掘很重要。数据挖掘是一个在海量数据中利用各种分析工具发现模型与数据间关系的过程,它可以帮助决策者寻找数据间潜在的某种关联,通过发现被隐藏的、被忽略的因素,就能够在数据存储和管理过程中,挖掘出重要的情报信息,作为决策和行动的依据。
例如,在“九一一”事件发生前,情报研判人员是掌握了大量数据的,但却忽视了其中有价值的情报,或者说没有挖掘出有价值的信息。因此,在“九一一”事件之后的美国国防部高级项目研究年会上,有人阐述了如何在统一集成的数据库中应用数据挖掘技术问题。其论述的关注点之一是“交易空间”。
所谓新的数据资源就是“交易空间”。如果恐怖分子要计划、执行一次恐怖活动,他们必定会在信息空间留下某种“数据脚印”。也就是说,他们需要“交易”。这种交易的数据记录,可能是通讯、财务、教育、医疗方面的,也可能是旅行、交通、出入境、房屋等各方面的。美国正是通过在“交易”空间中应用数据挖掘技术,来发现和追踪恐怖分子的。据说,2002年,阿富汗境内的大毒枭准备为基地组织的恐怖分子提供资金时,美军情报分析人员通过数据挖掘,把作战方案库里的数据与有关基地组织情况库里的资金数据进行了实时、自主关联,从而指导美军先敌一步采取了行动。
那么,如何从技术上提升数据挖掘能力呢?
在入口处对数据质量进行把控是非常关键的。也就是说,数据准备是数据挖掘的重要前提,因为它直接影响到数据挖掘的效率和精准度。如果质量参差不齐的数据统统进入通道,便很难再对质量不高的数据进行处理,其将对有用信息造成严重的干扰。
接着,运用数据挖掘的方法和手段,对各类数据库系统中存储的海量数据进行提取、分析、整合,就能生成具有更高价值的决策支持数据。当然,即使有大数据分析程序也要对其分析结果保持一定的谨慎,因为只要是人为设计的东西,都难免有缺陷,并不能摆脱曲解、隔阂和错误。有专家指出,偏见和盲区同样存在于大数据技术中,就像它们存在于个人的感觉和经验中一样。大数据重混杂性轻精确性、重相关性轻因果性,能够发现“是什么”而不探究“为什么”。大数据被用于验证人们对社会、战争的分析结论,有时比它提供分析结论更为合适。
4.消解缺少匹配决策机制难题
要有与数据分析配套的决策机制。信息化战争已经进入“秒杀”时代,而大数据技术能在很短时间内进行问题分析,应该说有其适应快速反应的优势。但如果没有与之相对应的指挥决策机制,大数据的这一优势也可能遭到削弱。如果军兵种间的壁垒仍然很高,各作战系统都在生产自己的数据且不与体系共享,那么大数据就难以发挥相应的作用。与之类似,如果指挥体制不能融合各种作战力量,让各军兵种自行其是,那么大数据即使分析出正确的结论,这一部队也会因正确结论经历的周转期过于冗长而错过最佳作战时机。
因此,要想真正利用大数据打仗,必须突出“网链聚能”,强化信息系统综合集成,充分利用高度融合、互联互通、资源共享的指挥信息系统,有效发挥信息流对物质流和能量流的支配作用,实现作战力量的高度聚合、作战资源的合理分配和作战效能的精确释放;着力实现数据资源的统一化、规范化、交互化、标准化,为信息系统综合集成提供稳定规范的数据环境。
5.破解大数据自身的安全隐患
新中国成立以来,我军建设先后经历了零散数据、纸质数据、小规模数据及目前的大数据等几个不同发展阶段,数据发挥的作用越来越大。
不过,大数据也带来了新的军事安全隐患。很多人现在一说到大数据就“谈虎色变”,重要的原因之一就是大数据挖掘和分析技术带来了用户隐私泄露等隐患。有专业人士指出,中国人口居世界首位,但2010年中国新存储的数据为250PB,仅为日本的60%和北美的7%。2012年中国的数据存储量达到64EB,其中55%的数据需要一定程度的保护,然而目前只有不到一半的数据得到了相应保护。
在国防和军队建设领域,大数据技术竞争日趋激烈,数字主权、数据安全的重要性急剧上升。随着数据量的爆炸性增长,一方面,数据库漏洞越来越多,可供攻击的目标随之增加,另一方面,隐藏在海量数据中的攻击行为往往难以被及时发现,核心数据的泄露将对国防和军队建设造成重大影响。例如,“棱镜门”事件就揭示出,在“棱镜”背后隐藏着一个庞大的“监视帝国”,我国的军事信息安全也无法置身事外。信息安全领域(尤其是军事信息安全领域),正在继陆地、海洋、天空、太空之后,成为又一个大国博弈的领域。
所谓“三军之事,莫重于密”,军事信息安全工作直接关系到军队信息化建设的全局和军事斗争的胜负,必须慎重对待:
一是构建网络信任体系。构建以实名制管理为核心,以身份认证、授权管理和责任认定为内容的可信任体系;
二是实施安全等级保护,科学区分保护等级,按级建立防护设施,使相关信息系统重要程度与安全保护能力相匹配;
三是完善技术防护措施,统一设计安全架构、统一建设防护手段、统一提供安全服务,为军事信息资源安全使用提供支撑保障。
可以说,大数据技术其实是一把双刃剑。它可以带来数据增值,但前提是数据整合,可整合就要求更大程度的开放。在军事领域如何在推动数据全面开放、应用和共享的同时,有效地保护公民、军事机构、非军事国家全安机构的信息安全,将是大数据强军领域亟待破解的一个难题。
——思想坦克编辑记者史德